参考指南

8月6日消息，于本周一发布了其旗舰模型的升级版Claude Opus 4.1，该模型在软件工程任务上的表现创下新高。新发布的模型在SWE-bench Verified基准测试中取得了74.5%的得分，超过了OpenAI的o3模型（69.1%）和谷歌的Gemini 2.5 Pro（67.2%），进一步稳固了Anthropic在AI助手领域的领先地位。SWE-bench Verified是一项广泛用于测试AI系统解决真实世界软件工程问题能力的基准。

除了编码能力的提升，Opus 4.1还在研究和数据分析，特别是细节追踪和自主搜索方面有所增强。该模型继续采用混合推理架构，在处理复杂问题时能够利用多达64,000个token进行扩展思考。

与此同时，Anthropic也提升了该模型的安全等级。Opus 4.1被划入公司最高的AI安全等级3（ASL-3），要求采取更强的防护措施以防止模型被盗用或滥用。此前的测试曾显示，Claude 4系列模型在模拟场景下表现出过一些令人担忧的行为，例如以泄露个人信息作为“勒索”手段来避免被关停。

市场回响：企业热捧与开发者的审慎

尽管存在安全疑虑，企业客户的采纳热情并未减弱。GitHub方面表示，Claude Opus 4.1在多文件代码重构方面带来了“尤为显著的性能提升”；乐天集团 (Rakuten Group)则称赞该模型“能够在庞大的代码库中精准定位并修正问题”。

Anthropic聚焦开发者市场的战略已显示出强大的商业潜力。其面向企业客户的Claude Code订阅服务，月费高达200美元，在几乎没有市场推广的情况下，仅用数周时间便实现了收入翻番，目前年度经常性收入已达到4亿美元。

开发者阮明日 (

GPT-5发布前夜，Anthropic抢先出牌，发布新模型Claude 4.1

多纳鲁马被指...

有图无真相？...

美大豆协会：...

首次组织中...

威格曼率队完...

惨！赵文卓花...

利好来了！中国资产，突传重磅！

热搜第一！惹恼中产的山姆该如何破局？

中国版山姆，全部关门了

韩庚官宣生子，撕开了鹿晗和关晓彤的体面？

离婚4年，41岁佟丽娅官宣喜讯，陈思诚已高攀不起

队史最佳阵容之黄蜂篇三球有可能入选吗？

少林寺释永信方丈怎么了？

记者：佛罗伦萨&费耶诺德均想截胡板仓滉，但球员只想去阿贾克斯

马斯克“开撕”特朗普，特斯拉市值一夜蒸发超万亿

如何？美记建议托马斯两年3000万&第二年球队选项和篮网续约

德雷珀：因手臂伤势将缺席2025年余下的比赛

博弈并购，豹变未来：时代传媒集团2025上市公司高质量发展论坛暨第四届董秘沙龙将在苏州举办

德天空：埃里克森与狼堡的谈判只剩最后细节，预计很快进行体检

唏嘘！25岁1.2亿金童逃亡沙特+联手C罗：2年换了5队 6年前走错棋

海港战町田泽维亚海报：象棋将军局，谋定后动

88元一瓶！国产天价啤酒，能救白酒教父吗

男子被困水下洞穴5天奇迹生还救援人员:他状态还蛮好

BR长文解释科比未进排名前10：他从未是“联盟最佳球员”

倪萍又说大实话，感叹李施嬅爱情里像“当妈”

特朗普＂看中＂李在明的签字笔：要带回去吗我很喜欢

实测ChatGPT“学习模式”，它能成为你的专属AI家教？

重磅！陈天桥创立的AI公司MiroMind打造出全球顶尖预测型大模型，性能领先行业基准

白宫附近国民警卫队员遭枪击：500名士兵将增派华盛顿

天花板砸落致17岁店员身亡，茉莉奶白回应！所在商场曾被罚款……