参考指南

8月6日消息，于本周一发布了其旗舰模型的升级版Claude Opus 4.1，该模型在软件工程任务上的表现创下新高。新发布的模型在SWE-bench Verified基准测试中取得了74.5%的得分，超过了OpenAI的o3模型（69.1%）和谷歌的Gemini 2.5 Pro（67.2%），进一步稳固了Anthropic在AI助手领域的领先地位。SWE-bench Verified是一项广泛用于测试AI系统解决真实世界软件工程问题能力的基准。

除了编码能力的提升，Opus 4.1还在研究和数据分析，特别是细节追踪和自主搜索方面有所增强。该模型继续采用混合推理架构，在处理复杂问题时能够利用多达64,000个token进行扩展思考。

与此同时，Anthropic也提升了该模型的安全等级。Opus 4.1被划入公司最高的AI安全等级3（ASL-3），要求采取更强的防护措施以防止模型被盗用或滥用。此前的测试曾显示，Claude 4系列模型在模拟场景下表现出过一些令人担忧的行为，例如以泄露个人信息作为“勒索”手段来避免被关停。

市场回响：企业热捧与开发者的审慎

尽管存在安全疑虑，企业客户的采纳热情并未减弱。GitHub方面表示，Claude Opus 4.1在多文件代码重构方面带来了“尤为显著的性能提升”；乐天集团 (Rakuten Group)则称赞该模型“能够在庞大的代码库中精准定位并修正问题”。

Anthropic聚焦开发者市场的战略已显示出强大的商业潜力。其面向企业客户的Claude Code订阅服务，月费高达200美元，在几乎没有市场推广的情况下，仅用数周时间便实现了收入翻番，目前年度经常性收入已达到4亿美元。

开发者阮明日 (

GPT-5发布前夜，Anthropic抢先出牌，发布新模型Claude 4.1

海天味业，又...

常州一家三口...

朱亚文评价白...

瑞纳智能成立...

分羹法拍房！...

昔日巨头接连...

多地发布风险提示，防范披着“稳定币”马甲的骗局

应聘者被骂「吃的不如狗」？格力回应；市占率存疑？影石回应市占率下滑及大疆价格战；零跑汽车辟谣将被一汽集团收购：消息不实丨雷峰早报

33岁中国男子在澳遭20名青少年围殴在ICU抢救30小时

女孩患重病每天工作20个小时曾10天收5份病危通知书

剑南春丨曼联1-1利兹联，阿伦森破门，齐尔克泽助攻库尼亚扳平

凤凰组合2-0程星/张驰，晋级韩国羽毛球公开赛混双4强

美媒：美方提出的28点新计划已缩减为19点

香港科大：用＂随机策略＂训练AI数学推理，效果竟然超越复杂算法

男子醉驾撞死女教师获刑两年半事发地附近有两所学校

成绩稀烂！记者：博卡青年足球委员会解散

中金黄金股价大跌，最新回应：涉事工厂已经停产，正处理善后工作

熊园：“十五五”GDP目标——怎么定、定多少？

净利润大跌47%！华润三九，业绩失速

马斯克的“AI女友”每月只要30美元

中国汽车产业跻身全球第二梯队，新能源领域竞争力领跑

朱光耀：中美AI实力对比，中国具备三项优势

半年亏损11.93亿美元，所以极星汽车还能活多久？

中东多个海水淡化厂受损引发饮用水武器化担忧

2025世界人工智能大会：有关AI的三个“灵魂之问”

与欧洲领导人通话特朗普“言辞强硬”

地狱笑话的背后，是新女性生存样本

去年的今天：辽宁将郭艾伦的顶薪独家签约权正式转让给广州

厂房沉降纠纷缠身，熊猫乳品两大募投项目延期

独家 | “小妖怪”总制片人：走出“浪浪山”第一步，挣到10亿