OpenAI近日推出三款实时语音模型,该系列模型具备GPT-5级别的推理能力与工具调用功能,可支持70余种语言的实时互译,每分钟使用成本约0.25元,较人类同声传译成本降低百倍;同时实现了低延迟的语音转录效果。三款模型均通过Realtime API对外开放,采用端到端处理技术,能够保留语音中的语调与情感信息。
OpenAI近日推出三款实时语音模型,该系列模型具备GPT-5级别的推理能力与工具调用功能,可支持70余种语言的实时互译,每分钟使用成本约0.25元,较人类同声传译成本降低百倍;同时实现了低延迟的语音转录效果。三款模型均通过Realtime API对外开放,采用端到端处理技术,能够保留语音中的语调与情感信息。