OpenBMB正式开源了参数规模达2B的语音合成模型VoxCPM2。该模型采用创新的无分词器扩散自回归架构,能够支持30种语言及中文方言,输出音质达到48kHz录音室级别。值得关注的是,VoxCPM2首创Voice Design功能,用户可通过文字描述直接生成全新声音;同时具备可控声音克隆与终极克隆模式。模型训练数据累计达236万小时,实时率低至0.13,且采用Apache-2.0协议,允许商用。