小米汽车正式推出全新框架,首次将三维重建与视频生成深度融合为一体化架构。该框架的重建模块采用稀疏三维锚点取代传统稠密高斯,处理10秒视频仅需10秒;生成模块通过两阶段训练与ODE蒸馏技术,实现4步去噪,生成效率达0.19秒每帧,支持最长1分钟视频的生成。
小米汽车正式推出全新框架,首次将三维重建与视频生成深度融合为一体化架构。该框架的重建模块采用稀疏三维锚点取代传统稠密高斯,处理10秒视频仅需10秒;生成模块通过两阶段训练与ODE蒸馏技术,实现4步去噪,生成效率达0.19秒每帧,支持最长1分钟视频的生成。