通义实验室近日推出两款全新语音生成模型——Fun-CosyVoice3.5与Fun-AudioGen-VD,创新采用FreeStyle指令控制范式,用户无需依赖固定标签,仅通过自然语言即可精准描述语气、情绪、场景等细节。其中,Fun-CosyVoice3.5支持多语种语音复刻与精细化表达控制,新增泰语、印尼语等4个小语种,生僻字读错率低至5.3%;Fun-AudioGen-VD则实现端到端声音设计,能够生成角色化音色并模拟环境声学效果。