人工智能(AI)模型的竞赛再度升温。在OpenAI即将发布备受期待的GPT-5之际,Anthropic率先升级自家模型,推出Claude Opus 4.1,声称在编程、研究和数据分析能力方面实现显著提升。
美东时间8月5日周二,由前OpenAI员工创立的OpenAI劲敌Anthropic宣布,新模型Opus 4.1在编程评估基准SWE-Bench Verified上的得分达到74.5%,较前代Opus 4的72.5%提升两个百分点。
新模型在处理大型代码库导航和多文件代码重构方面表现尤为突出。GitHub、Rakuten Group等客户反馈显示,Opus 4.1在代码修改精准度和调试效率方面均有显著改善,能够在不引入漏洞的情况下精确定位需要修正的代码位置。
面对OpenAI本月可能发布GPT-5的竞争压力,Anthropic选择聚焦现有产品优化。
Anthropic的首席产品官Mike Krieger表示,此次Opus模型升级标志着公司战略转向更频繁的渐进式改进,而非仅专注重大版本更新。他说:
“过去,我们过于专注于只提供重要的升级。(模型)它现在在编码、推理和代理任务方面都更胜一筹。我们只是想让它更好地服务于人类。”
性能提升聚焦编程领域
Anthropic公布的数据显示,Opus 4.1在编程能力方面实现了实质性突破。
Anthropic公布,