小米机器人事业部正式开源Xiaomi-Robotics-0大模型的真机后训练全流程。该流程基于预训练基座,仅需20小时任务数据即可完成耳机收纳等高精度操作。团队采用异步推理、动作前缀及自适应加权、Λ型掩码、随机遮蔽三重策略,有效破解模型“偷懒效应”,实现了动作连贯性与视觉灵敏性的平衡。