Qwen3-TTS全家桶开源上线！

2026-01-28 #AI新闻

通义千问团队正式开源系列语音生成模型，包含1.7B和0.6B两种参数规模，全面支持音色克隆、音色创造与拟人化语音生成。采用创新的12Hz多码本语音编码器与双轨建模架构，实现高效语音压缩与高保真还原，首包音频延迟低至97毫秒。模型覆盖中、英、日、韩等10种主流语言及方言，支持自然语言指令精确控制音色、情感及韵律。

Qwen3-TTS全家桶开源上线！

相关推荐

阿里通义千问发布Qwen3.5-Max-Preview旗舰模型预览版

商汤大装置、大晓机器人与广西产业技术研究院携手战略合作赋能广西具身智能产业升级

腾讯QClaw全量公测开放，无邀请码即可下载使用

生数科技旗下Vidu AI平台发布「V龙」智能体提供一站式商用AI视频解决方案