关闭广告

GPT-5发布前夜,Anthropic抢先出牌,发布新模型Claude 4.1

网易科技报道2025-08-07 00:00:019402人阅读

8月6日消息,于本周一发布了其旗舰模型的升级版Claude Opus 4.1,该模型在软件工程任务上的表现创下新高。新发布的模型在SWE-bench Verified基准测试中取得了74.5%的得分,超过了OpenAI的o3模型(69.1%)和谷歌的Gemini 2.5 Pro(67.2%),进一步稳固了Anthropic在AI助手领域的领先地位。SWE-bench Verified是一项广泛用于测试AI系统解决真实世界软件工程问题能力的基准。

除了编码能力的提升,Opus 4.1还在研究和数据分析,特别是细节追踪和自主搜索方面有所增强。该模型继续采用混合推理架构,在处理复杂问题时能够利用多达64,000个token进行扩展思考。

与此同时,Anthropic也提升了该模型的安全等级。Opus 4.1被划入公司最高的AI安全等级3(ASL-3),要求采取更强的防护措施以防止模型被盗用或滥用。此前的测试曾显示,Claude 4系列模型在模拟场景下表现出过一些令人担忧的行为,例如以泄露个人信息作为“勒索”手段来避免被关停。

市场回响:企业热捧与开发者的审慎

尽管存在安全疑虑,企业客户的采纳热情并未减弱。GitHub方面表示,Claude Opus 4.1在多文件代码重构方面带来了“尤为显著的性能提升”;乐天集团 (Rakuten Group)则称赞该模型“能够在庞大的代码库中精准定位并修正问题”。

Anthropic聚焦开发者市场的战略已显示出强大的商业潜力。其面向企业客户的Claude Code订阅服务,月费高达200美元,在几乎没有市场推广的情况下,仅用数周时间便实现了收入翻番,目前年度经常性收入已达到4亿美元。

开发者阮明日 (

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

安踏继续“买买买”?锐步再陷“易主”风波

中国商报 浏览 10159 08-07

卡斯卡里诺:变成边缘人对格拉利什打击很大,埃弗顿会是很好选择

直播吧 浏览 512 08-11

巴特勒盛赞布克单打能力:他会一边倒获胜!可以11投10中

Emily说个球 浏览 8943 07-21

恒瑞前董事长周云曙履新先声药业,曾在恒瑞工作超25年

YOUNG财经 浏览 208 01-05

财报前瞻 | 上市后暴涨400%!加密货币狂飙之际,稳定币“妖股”Circle(CRCL.US)IPO后首份财报今晚来袭

智通财经 浏览 969 08-12

《唐朝诡事录3》第一波真实口碑出炉!

娱乐圈笔娱君 浏览 236 11-09

罗伯特-桑切斯:有人说我们夺冠之路轻松,但其实一点也不

懂球帝 浏览 8935 07-14

夸克上线千问助手,使用阿里Qwen最强大模型

IT之家 浏览 227 11-17

美媒评21世纪七大奖项:詹姆斯获三项大奖 马刺成员赢得其余四项

罗说NBA 浏览 412 08-20

240亿身家“造纸女王”,要“翻身”了

侃见财经 浏览 7983 07-27

吉尔贝托:枪手要给道曼提供支持,不要给他施加太多的压力

懂球帝 浏览 328 10-13

搭Flyme Auto座舱 全新博越8月2日开启预售

车质网 浏览 6416 08-01

特朗普威胁对俄方征收100%关税 将对俄发表"重大声明"

国际在线 浏览 1625 07-15

以色列航空计划复飞特拉维夫机场国际航班

财联社 浏览 10212 06-23

巴西正式退回美方威胁信函 卢拉:对等反制美国关税

环球网资讯 浏览 991 07-11

“反向春运”火了!部分火车票低至1.9折,南京到上海只要8.5元

上观新闻 浏览 186 02-02

打破观众人数纪录!官方:美网混双共有78000名球迷到场观看

直播吧 浏览 442 08-22

袭击伊朗核设施的B-2轰炸机返美 美披露整个袭击行动详情

环球时报 浏览 841 06-24

巴基斯坦与沙特签协议被指影响超越中东 引发多国震动

环球网资讯 浏览 430 09-19

亚冠精英东亚区积分榜:成都蓉城第6,申花、海港分列9、11

懂球帝 浏览 327 10-02

国庆期间境外旅游,警惕猴痘、登革热!

人民网 浏览 5195 10-01
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11