谷歌于近日发布了Gemini 3 Deep Think深度思考大模型的重大升级版本。该新版模型在多项国际顶尖基准测试中表现卓越,一举刷新多项纪录。其中,在竞技编程平台Codeforces上,其Elo评级达到3455分,位列全球第八,这意味着目前仅有7位顶尖程序员能够在比赛中胜过它。此外,该模型在ARC-AGI-2推理基准测试、不使用工具的“人类的最后考试”,以及物理、化学奥林匹克笔试等多个高难度学术竞赛中,均取得了金牌级别的领先成绩。