阶跃星辰近日推出新一代自动语音识别模型StepAudio 2.5 ASR。该模型在行业内首次将大语言模型推理加速技术应用于语音识别领域,采用ASR+MTP-5架构,实现推理速度提升400%、时延降低60%,峰值处理速度可达500 tokens/s,同时成本直接下降80%。在多项中英文主流评测基准测试中,该模型均达到了当前最优(SOTA)水平,并且复用32K上下文窗口,单次可完整转写时长30分钟的音频内容。
阶跃星辰近日推出新一代自动语音识别模型StepAudio 2.5 ASR。该模型在行业内首次将大语言模型推理加速技术应用于语音识别领域,采用ASR+MTP-5架构,实现推理速度提升400%、时延降低60%,峰值处理速度可达500 tokens/s,同时成本直接下降80%。在多项中英文主流评测基准测试中,该模型均达到了当前最优(SOTA)水平,并且复用32K上下文窗口,单次可完整转写时长30分钟的音频内容。