MiniMax近日推出M2.7模型,该模型首次实现了深度参与自身迭代的能力。它能够构建复杂的Agent Harness,借助Agent Teams、复杂Skills等功能完成高难度的生产力任务。在软件工程领域,M2.7在SWE-Pro基准测试中获得56.22%的分数,已接近Opus水平;在VIBE-Pro端到端项目交付测试中,其得分达到55.6%。在专业办公领域,该模型在GDPval-AA的ELO评分中取得1495分,为开源模型中的最高水平。