关闭广告

GPT-5发布前夜,Anthropic抢先出牌,发布新模型Claude 4.1

网易科技报道2025-08-07 00:00:019226人阅读

8月6日消息,于本周一发布了其旗舰模型的升级版Claude Opus 4.1,该模型在软件工程任务上的表现创下新高。新发布的模型在SWE-bench Verified基准测试中取得了74.5%的得分,超过了OpenAI的o3模型(69.1%)和谷歌的Gemini 2.5 Pro(67.2%),进一步稳固了Anthropic在AI助手领域的领先地位。SWE-bench Verified是一项广泛用于测试AI系统解决真实世界软件工程问题能力的基准。

除了编码能力的提升,Opus 4.1还在研究和数据分析,特别是细节追踪和自主搜索方面有所增强。该模型继续采用混合推理架构,在处理复杂问题时能够利用多达64,000个token进行扩展思考。

与此同时,Anthropic也提升了该模型的安全等级。Opus 4.1被划入公司最高的AI安全等级3(ASL-3),要求采取更强的防护措施以防止模型被盗用或滥用。此前的测试曾显示,Claude 4系列模型在模拟场景下表现出过一些令人担忧的行为,例如以泄露个人信息作为“勒索”手段来避免被关停。

市场回响:企业热捧与开发者的审慎

尽管存在安全疑虑,企业客户的采纳热情并未减弱。GitHub方面表示,Claude Opus 4.1在多文件代码重构方面带来了“尤为显著的性能提升”;乐天集团 (Rakuten Group)则称赞该模型“能够在庞大的代码库中精准定位并修正问题”。

Anthropic聚焦开发者市场的战略已显示出强大的商业潜力。其面向企业客户的Claude Code订阅服务,月费高达200美元,在几乎没有市场推广的情况下,仅用数周时间便实现了收入翻番,目前年度经常性收入已达到4亿美元。

开发者阮明日 (

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

韩庚官宣生子,撕开了鹿晗和关晓彤的体面?

包饺子ai剪辑 浏览 68 11-03

离婚4年,41岁佟丽娅官宣喜讯,陈思诚已高攀不起

淼犇小牛 浏览 9208 07-29

队史最佳阵容之黄蜂篇 三球有可能入选吗?

仰卧撑FTUer 浏览 1215 08-12

少林寺释永信方丈怎么了?

正经社 浏览 6395 07-28

记者:佛罗伦萨&费耶诺德均想截胡板仓滉,但球员只想去阿贾克斯

直播吧 浏览 8856 08-07

马斯克“开撕”特朗普,特斯拉市值一夜蒸发超万亿

汽车公社 浏览 297 06-06

如何?美记建议托马斯两年3000万&第二年球队选项和篮网续约

直播吧 浏览 314 08-11

德雷珀:因手臂伤势将缺席2025年余下的比赛

懂球帝 浏览 202 09-09

博弈并购,豹变未来:时代传媒集团2025上市公司高质量发展论坛暨第四届董秘沙龙将在苏州举办

时代周报 浏览 233 09-02

德天空:埃里克森与狼堡的谈判只剩最后细节,预计很快进行体检

直播吧 浏览 175 09-11

唏嘘!25岁1.2亿金童逃亡沙特+联手C罗:2年换了5队 6年前走错棋

风过乡 浏览 3297 07-28

海港战町田泽维亚海报:象棋将军局,谋定后动

懂球帝 浏览 105 10-21

88元一瓶!国产天价啤酒,能救白酒教父吗

说财猫 浏览 3419 08-07

男子被困水下洞穴5天奇迹生还 救援人员:他状态还蛮好

扬子晚报 浏览 7239 07-27

BR长文解释科比未进排名前10:他从未是“联盟最佳球员”

懂球帝 浏览 3382 07-16

倪萍又说大实话,感叹李施嬅爱情里像“当妈”

疯说时尚 浏览 56 11-02

特朗普"看中"李在明的签字笔:要带回去吗 我很喜欢

上观新闻 浏览 294 08-27

实测ChatGPT“学习模式”,它能成为你的专属AI家教?

三言科技 浏览 2359 07-30

重磅!陈天桥创立的AI公司MiroMind打造出全球顶尖预测型大模型,性能领先行业基准

钛媒体APP 浏览 169 09-22

白宫附近国民警卫队员遭枪击:500名士兵将增派华盛顿

澎湃新闻 浏览 137 11-27

天花板砸落致17岁店员身亡,茉莉奶白回应!所在商场曾被罚款……

国际金融报 浏览 286 08-19
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11