阿里正式发布其规模最大、能力最强的推理模型。模型总参数量超万亿,预训练数据达36T Tokens,在多项国际专业基准测试中刷新纪录。其创新性地采用了测试时扩展机制,在提升推理性能的同时更加经济。 文章导航 英伟达20亿美元加码CoreWeave,冲刺5GW算力DeepSeek又探索新架构了,开源DeepSeek-OCR 2