阿里云千问团队开源系列语音识别模型,包含1.7B/0.6B参数版本及强制对齐模型。该系列支持52种语言与方言识别,覆盖中文22种地方口音及多国英语变体,在嘈杂环境、歌唱场景下均表现稳定。 文章导航 昆仑万维开源视频生成模型SkyReels-V3,重塑创作流程OpenAI宣布2月13日下线GPT-4o等旧模型