火山引擎近日推出「豆包音频生成模型1.0」,该模型首次实现文本或音频参考输入的支持,能够端到端生成目标音频。用户可在单条提示词中完成多角色对白、情绪语气、背景音乐及环境氛围的编排,直接产出完整音频作品,且在长时生成过程中可保持音色的一致性。 文章导航 豆包专业版正式发布 助力专业高效办公