由通义实验室研发的通用具身智能统一动作框架Qwen-VLA正式推出,该框架以Qwen3.5-4B为基础模型,搭配DiT动作解码器,借助统一动作轨迹预测框架、本体感知提示条件化以及文本到动作预训练(T2A)技术,成功将操作、导航与轨迹预测功能整合为单一通用具身模型。该模型在多项基准测试中表现优于专用模型,可支持11种不同机器人平台的跨本体控制。
由通义实验室研发的通用具身智能统一动作框架Qwen-VLA正式推出,该框架以Qwen3.5-4B为基础模型,搭配DiT动作解码器,借助统一动作轨迹预测框架、本体感知提示条件化以及文本到动作预训练(T2A)技术,成功将操作、导航与轨迹预测功能整合为单一通用具身模型。该模型在多项基准测试中表现优于专用模型,可支持11种不同机器人平台的跨本体控制。