智谱开放平台正式发布GLM-5.1高速版API,该模型输出速度达到400 tokens/s,刷新了全球大模型API的速度上限。GLM-5.1-highspeed由智谱与TileRT团队联合研发,在国产大模型中首次实现了旗舰级能力与极致低延迟的双重优势,适用于AI编程、实时交互、实时语音等对延迟要求极高的场景,目前已面向部分企业客户开放使用。
智谱开放平台正式发布GLM-5.1高速版API,该模型输出速度达到400 tokens/s,刷新了全球大模型API的速度上限。GLM-5.1-highspeed由智谱与TileRT团队联合研发,在国产大模型中首次实现了旗舰级能力与极致低延迟的双重优势,适用于AI编程、实时交互、实时语音等对延迟要求极高的场景,目前已面向部分企业客户开放使用。