火山引擎近日正式推出豆包实时语音模型3.0 API服务,并同步开启邀请测试。该模型作为原生全双工端到端语音大模型,拥有精准遵循指令、强抗干扰能力、动态智能判停三大核心优势,能够在实时对话过程中调用工具执行任务,达成边听、边说、边办事的高效交互体验。经测试,其判停延迟较之前缩短约250毫秒,复杂场景下的抢话比例降低40%。
火山引擎近日正式推出豆包实时语音模型3.0 API服务,并同步开启邀请测试。该模型作为原生全双工端到端语音大模型,拥有精准遵循指令、强抗干扰能力、动态智能判停三大核心优势,能够在实时对话过程中调用工具执行任务,达成边听、边说、边办事的高效交互体验。经测试,其判停延迟较之前缩短约250毫秒,复杂场景下的抢话比例降低40%。