【品牌公告】原“7牛AI PPT”已正式更名为“即触AI PPT”（jcppt.com），老用户权益与服务已同步顺延。

阿里通义发布PrismAudio：实现声画同步，音效动态适配

2026-03-24 #AI新闻

阿里通义实验室近期推出一款视频生成音频框架PrismAudio，主要聚焦于环境音与音效的合成。该模型创新性地融合强化学习与思维链技术，借助“分解式思维链”机制，先对视频的内容、时序、音质及空间位置等要素进行分析，再生成对应的音频。同时，模型引入语义、时序、美学、空间四位“评估老师”，通过分别打分的方式对生成的音频效果进行优化。

AI快讯

阿里通义发布PrismAudio：实现声画同步，音效动态适配

相关推荐

阿里巴巴宣布全面禁用Anthropic旗下Claude系列产品

英伟达发布开源双塔架构扩散语言模型 Nemotron-Labs-TwoTower

谷歌推出开源零样本表格基础模型TabFM

元空AI发布企业级桌面版AI数据智能体ChatExcel Ultra