快手近日宣布正式开源其自研的多模态大模型Keye-VL-2.0-30B-A3B。该模型首次将DSA稀疏注意力机制应用于多模态理解领域,可支持256K的超长上下文处理,能够实现长视频的时序因果推理。在TimeLens视频理解基准测试中,该模型部分指标表现优于Gemini 2.5 Pro与Gemini 3 Flash。此外,该模型还首次具备了Agent协作能力,可覆盖代码编写、工具调用及搜索等复杂任务场景。
快手近日宣布正式开源其自研的多模态大模型Keye-VL-2.0-30B-A3B。该模型首次将DSA稀疏注意力机制应用于多模态理解领域,可支持256K的超长上下文处理,能够实现长视频的时序因果推理。在TimeLens视频理解基准测试中,该模型部分指标表现优于Gemini 2.5 Pro与Gemini 3 Flash。此外,该模型还首次具备了Agent协作能力,可覆盖代码编写、工具调用及搜索等复杂任务场景。