阿里巴巴推出端到端语音识别大模型Fun-ASR1.5,该模型单模型可覆盖30种语言,支持自动语种切换以及跨语言混说功能。同时,它覆盖了中文七大方言体系,字错误率相比上一版本降低56.2%,新增的古诗词专项识别准确率达到97%。Fun-ASR1.5采用MoE架构,具备智能标点预测以及数字、日期等文本归一化能力,目前已在阿里云百炼和魔搭社区上线。
阿里巴巴推出端到端语音识别大模型Fun-ASR1.5,该模型单模型可覆盖30种语言,支持自动语种切换以及跨语言混说功能。同时,它覆盖了中文七大方言体系,字错误率相比上一版本降低56.2%,新增的古诗词专项识别准确率达到97%。Fun-ASR1.5采用MoE架构,具备智能标点预测以及数字、日期等文本归一化能力,目前已在阿里云百炼和魔搭社区上线。