阿里通义语音双模型Fun-CosyVoice3.5与Fun-AudioGen-VD正式发布

2026-03-03 #AI新闻

通义实验室近日推出两款全新语音生成模型——Fun-CosyVoice3.5与Fun-AudioGen-VD，创新采用FreeStyle指令控制范式，用户无需依赖固定标签，仅通过自然语言即可精准描述语气、情绪、场景等细节。其中，Fun-CosyVoice3.5支持多语种语音复刻与精细化表达控制，新增泰语、印尼语等4个小语种，生僻字读错率低至5.3%；Fun-AudioGen-VD则实现端到端声音设计，能够生成角色化音色并模拟环境声学效果。

阿里通义语音双模型Fun-CosyVoice3.5与Fun-AudioGen-VD正式发布

相关推荐

阿里通义语音双模型Fun-CosyVoice3.5与Fun-AudioGen-VD正式发布

小红书推出并开源端到端文档识别模型FireRed-OCR

阿里千问开源四款Qwen3.5小尺寸模型覆盖多场景轻量级AI需求

3小时→10分钟！我用这个AI神器搞定科室病例汇报，主任当场表扬