参考指南

8月6日消息，于本周一发布了其旗舰模型的升级版Claude Opus 4.1，该模型在软件工程任务上的表现创下新高。新发布的模型在SWE-bench Verified基准测试中取得了74.5%的得分，超过了OpenAI的o3模型（69.1%）和谷歌的Gemini 2.5 Pro（67.2%），进一步稳固了Anthropic在AI助手领域的领先地位。SWE-bench Verified是一项广泛用于测试AI系统解决真实世界软件工程问题能力的基准。

除了编码能力的提升，Opus 4.1还在研究和数据分析，特别是细节追踪和自主搜索方面有所增强。该模型继续采用混合推理架构，在处理复杂问题时能够利用多达64,000个token进行扩展思考。

与此同时，Anthropic也提升了该模型的安全等级。Opus 4.1被划入公司最高的AI安全等级3（ASL-3），要求采取更强的防护措施以防止模型被盗用或滥用。此前的测试曾显示，Claude 4系列模型在模拟场景下表现出过一些令人担忧的行为，例如以泄露个人信息作为“勒索”手段来避免被关停。

市场回响：企业热捧与开发者的审慎

尽管存在安全疑虑，企业客户的采纳热情并未减弱。GitHub方面表示，Claude Opus 4.1在多文件代码重构方面带来了“尤为显著的性能提升”；乐天集团 (Rakuten Group)则称赞该模型“能够在庞大的代码库中精准定位并修正问题”。

Anthropic聚焦开发者市场的战略已显示出强大的商业潜力。其面向企业客户的Claude Code订阅服务，月费高达200美元，在几乎没有市场推广的情况下，仅用数周时间便实现了收入翻番，目前年度经常性收入已达到4亿美元。

开发者阮明日 (

GPT-5发布前夜，Anthropic抢先出牌，发布新模型Claude 4.1

媒体：特朗普...

张兰和孙辈们...

释永信曾被传...

全面推动汽车...

俄美领导人为...

外媒：五角大...

追觅宣布将推全球首款双机械臂洗地机，首次引入“具身智能”理念

湖南卫视评论区沦陷！歌王名单泄露、耳返故障，网友质疑有黑幕

“一个杯子开15次会”？小米徐洁云：至少开了16次

安踏继续“买买买”？锐步再陷“易主”风波

卡斯卡里诺：变成边缘人对格拉利什打击很大，埃弗顿会是很好选择

巴特勒盛赞布克单打能力：他会一边倒获胜！可以11投10中

恒瑞前董事长周云曙履新先声药业，曾在恒瑞工作超25年

财报前瞻 | 上市后暴涨400%！加密货币狂飙之际，稳定币“妖股”Circle(CRCL.US)IPO后首份财报今晚来袭

《唐朝诡事录3》第一波真实口碑出炉！

罗伯特-桑切斯：有人说我们夺冠之路轻松，但其实一点也不

夸克上线千问助手，使用阿里Qwen最强大模型

美媒评21世纪七大奖项：詹姆斯获三项大奖马刺成员赢得其余四项

240亿身家“造纸女王”，要“翻身”了

吉尔贝托：枪手要给道曼提供支持，不要给他施加太多的压力

搭Flyme Auto座舱全新博越8月2日开启预售

特朗普威胁对俄方征收100%关税将对俄发表＂重大声明＂

以色列航空计划复飞特拉维夫机场国际航班

巴西正式退回美方威胁信函卢拉：对等反制美国关税

“反向春运”火了！部分火车票低至1.9折，南京到上海只要8.5元

打破观众人数纪录！官方：美网混双共有78000名球迷到场观看

袭击伊朗核设施的B-2轰炸机返美美披露整个袭击行动详情

巴基斯坦与沙特签协议被指影响超越中东引发多国震动

亚冠精英东亚区积分榜：成都蓉城第6，申花、海港分列9、11

国庆期间境外旅游，警惕猴痘、登革热！