【品牌公告】原“7牛AI PPT”已正式更名为“即触AI PPT”（jcppt.com），老用户权益与服务已同步顺延。

小米发布开源可控视频音效生成模型ControlFoley

2026-06-01 #AI新闻

小米大模型应用团队近日宣布开源可控视频音效生成模型ControlFoley，该模型可统一支持文本引导视频配音、文本控制视频配音及参考音频控制视频配音三类任务。通过采用联合视觉编码、时间-音色解耦与模态鲁棒训练等技术，ControlFoley有效解决了现有方案中文本控制能力弱、参考音频与视频难同步等痛点问题，并在VGGSound-Test等多个权威基准测试中取得了开源领域的SOTA（ state-of-the-art，最先进）表现。

AI快讯

小米发布开源可控视频音效生成模型ControlFoley

相关推荐

MiniMax发布开源新一代AI模型MiniMax M3

小米发布开源可控视频音效生成模型ControlFoley

扣子3.0版本正式发布全面覆盖多平台

零一万物三周年：李开复宣布启动二次创业目标成为中国首家盈利AI 2.0公司