关闭广告

GPT-5发布前夜,Anthropic抢先出牌,发布新模型Claude 4.1

网易科技报道2025-08-07 00:00:019166人阅读

8月6日消息,于本周一发布了其旗舰模型的升级版Claude Opus 4.1,该模型在软件工程任务上的表现创下新高。新发布的模型在SWE-bench Verified基准测试中取得了74.5%的得分,超过了OpenAI的o3模型(69.1%)和谷歌的Gemini 2.5 Pro(67.2%),进一步稳固了Anthropic在AI助手领域的领先地位。SWE-bench Verified是一项广泛用于测试AI系统解决真实世界软件工程问题能力的基准。

除了编码能力的提升,Opus 4.1还在研究和数据分析,特别是细节追踪和自主搜索方面有所增强。该模型继续采用混合推理架构,在处理复杂问题时能够利用多达64,000个token进行扩展思考。

与此同时,Anthropic也提升了该模型的安全等级。Opus 4.1被划入公司最高的AI安全等级3(ASL-3),要求采取更强的防护措施以防止模型被盗用或滥用。此前的测试曾显示,Claude 4系列模型在模拟场景下表现出过一些令人担忧的行为,例如以泄露个人信息作为“勒索”手段来避免被关停。

市场回响:企业热捧与开发者的审慎

尽管存在安全疑虑,企业客户的采纳热情并未减弱。GitHub方面表示,Claude Opus 4.1在多文件代码重构方面带来了“尤为显著的性能提升”;乐天集团 (Rakuten Group)则称赞该模型“能够在庞大的代码库中精准定位并修正问题”。

Anthropic聚焦开发者市场的战略已显示出强大的商业潜力。其面向企业客户的Claude Code订阅服务,月费高达200美元,在几乎没有市场推广的情况下,仅用数周时间便实现了收入翻番,目前年度经常性收入已达到4亿美元。

开发者阮明日 (

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

"反诈老陈"打假"嘎子哥"直播间手机 旗舰店:无此产品

极目新闻 浏览 237 08-25

50+女人如何反油腻?穿衣不扮嫩不花哨,尽显年轻气质

静儿时尚达人 浏览 1345 06-08

永恒经典!赵丹大师诞辰110周年纪念展开启

幕味儿 浏览 132 09-10

图多尔:在维罗纳执教的那一年很美好 小孔塞桑踢不满90分钟

直播吧 浏览 116 09-21

对话京东何晓冬:不担心具身智能过热,卖大模型API并非健康商业模式

钛媒体APP 浏览 10066 07-29

曼联vs切尔西:加纳乔、库尼亚替补,马奎尔、埃斯特旺首发

懂球帝 浏览 121 09-21

从抖音吵到微博!陈震vs星冰乐,这场骂战到底谁赢了?

雷科技 浏览 251 08-25

新能源汽车的轮胎,为啥那么贵?

小李车评李建红 浏览 17 10-25

袁姗姗哀牢山“上班记”:当明星特权遇上蚂蟥

梦涵影娱 浏览 6230 07-23

定位低于超级维特拉 铃木全新SUV测试车曝光

车质网 浏览 6061 07-28

00后女孩300元网售5盒药品被控贩毒 二审法院发回重审

澎湃新闻 浏览 9589 07-31

上市前突击分红、社保公积金却欠缴:证监会九问巴奴

地产深度报道 浏览 8840 08-14

《黑神话》背后的海马云,冲刺港股打持久战

斑马消费 浏览 6411 07-14

蜜雪冰城冰淇淋,怎么化得这么快?

中国新闻周刊 浏览 7879 08-11

为什么越来越多的车企爱去赛道?

网易汽车 浏览 9556 07-04

毫无底线!博主到大S墓地直播

失宠的小野猪 浏览 3586 08-07

中国一招“打拉结合”,美国恐怕是招架不住了

浏览 5481 07-14

吃饭做作别硬演!《以法之名》陈胜龙一出手,带来教科书式炫火锅

娱乐圈笔娱君 浏览 3194 07-09

洪森晒图驳斥"乘专机飞往中国"传言:没逃往任何地方

环球网资讯 浏览 7230 07-25

美军这一轮报复性空袭,或许可给中国“解围”

浏览 7361 07-14

上海国资出手!300841,提前暴涨16%,今日复牌

中国基金报 浏览 3877 07-21
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11