谷歌近日正式推出全新实时语音互译模型Gemini 3.5 Live Translate,该模型能够自动识别70多种语言,并生成既保留原说话者语调、语速和音高特点,又流畅自然的翻译语音。在实际应用中,该模型巧妙平衡了等待上下文与即时翻译的需求,翻译速度仅比说话者慢几秒。目前,开发者可通过Gemini Live API预览版接入该模型,企业用户能在Google Meet中使用其功能,普通用户则可通过谷歌翻译App体验这一实时翻译服务。
谷歌近日正式推出全新实时语音互译模型Gemini 3.5 Live Translate,该模型能够自动识别70多种语言,并生成既保留原说话者语调、语速和音高特点,又流畅自然的翻译语音。在实际应用中,该模型巧妙平衡了等待上下文与即时翻译的需求,翻译速度仅比说话者慢几秒。目前,开发者可通过Gemini Live API预览版接入该模型,企业用户能在Google Meet中使用其功能,普通用户则可通过谷歌翻译App体验这一实时翻译服务。