Anthropic正式推出旗下旗舰级大语言模型Claude Opus 4.8。该模型在终端工程、知识工作等领域的能力实现显著提升,部分性能指标已超越尚未发布的Mythos模型。其核心改进聚焦于诚实性方面:代码缺陷漏报率较前代模型降低至四分之一,过度自信行为的发生概率则降至十分之一。Cursor与Devin的首席执行官均对该模型给予了高度评价。
Anthropic正式推出旗下旗舰级大语言模型Claude Opus 4.8。该模型在终端工程、知识工作等领域的能力实现显著提升,部分性能指标已超越尚未发布的Mythos模型。其核心改进聚焦于诚实性方面:代码缺陷漏报率较前代模型降低至四分之一,过度自信行为的发生概率则降至十分之一。Cursor与Devin的首席执行官均对该模型给予了高度评价。