面壁智能与清华大学、OpenBMB开源社区合作,推出我国首个完全依托华为昇腾国产算力平台完成端到端训练的1.58-bit三值大模型BitCPM-CANN,该模型涵盖0.5B到8B四个不同尺寸。模型采用量化感知训练方式,在推理阶段可释放约6倍的显存优势,模型能力保留率介于90%至97.2%之间,为端侧AI的落地应用以及国产NPU生态体系构建提供了重要的基础设施支撑。
面壁智能与清华大学、OpenBMB开源社区合作,推出我国首个完全依托华为昇腾国产算力平台完成端到端训练的1.58-bit三值大模型BitCPM-CANN,该模型涵盖0.5B到8B四个不同尺寸。模型采用量化感知训练方式,在推理阶段可释放约6倍的显存优势,模型能力保留率介于90%至97.2%之间,为端侧AI的落地应用以及国产NPU生态体系构建提供了重要的基础设施支撑。