关闭广告

GPT-5发布前夜,Anthropic抢先出牌,发布新模型Claude 4.1

网易科技报道2025-08-07 00:00:019404人阅读

8月6日消息,于本周一发布了其旗舰模型的升级版Claude Opus 4.1,该模型在软件工程任务上的表现创下新高。新发布的模型在SWE-bench Verified基准测试中取得了74.5%的得分,超过了OpenAI的o3模型(69.1%)和谷歌的Gemini 2.5 Pro(67.2%),进一步稳固了Anthropic在AI助手领域的领先地位。SWE-bench Verified是一项广泛用于测试AI系统解决真实世界软件工程问题能力的基准。

除了编码能力的提升,Opus 4.1还在研究和数据分析,特别是细节追踪和自主搜索方面有所增强。该模型继续采用混合推理架构,在处理复杂问题时能够利用多达64,000个token进行扩展思考。

与此同时,Anthropic也提升了该模型的安全等级。Opus 4.1被划入公司最高的AI安全等级3(ASL-3),要求采取更强的防护措施以防止模型被盗用或滥用。此前的测试曾显示,Claude 4系列模型在模拟场景下表现出过一些令人担忧的行为,例如以泄露个人信息作为“勒索”手段来避免被关停。

市场回响:企业热捧与开发者的审慎

尽管存在安全疑虑,企业客户的采纳热情并未减弱。GitHub方面表示,Claude Opus 4.1在多文件代码重构方面带来了“尤为显著的性能提升”;乐天集团 (Rakuten Group)则称赞该模型“能够在庞大的代码库中精准定位并修正问题”。

Anthropic聚焦开发者市场的战略已显示出强大的商业潜力。其面向企业客户的Claude Code订阅服务,月费高达200美元,在几乎没有市场推广的情况下,仅用数周时间便实现了收入翻番,目前年度经常性收入已达到4亿美元。

开发者阮明日 (

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

婚姻的现实冷暖,在45岁的沈腾身上暴露了出来

寻墨阁 浏览 364 09-20

白宫否认“普特会”文件泄密

环球时报国际 浏览 480 08-18

蔚来公司9月交付34749台 同比增长64%

网易汽车 浏览 346 10-02

在场-40遭20岁超星碾压:33岁奥迪14中5吞惨烈一战 重返NBA搁浅?

颜小白的篮球梦 浏览 317 10-14

280亿国产AI独角兽,惹怒“地表最强法务部”

雷达财经 浏览 347 09-20

美国科罗拉多州两架小型飞机空中相撞 致1死3伤

环球网资讯 浏览 393 09-02

牛弹琴:特朗普现在很头疼 俄乌说一套做一套让他愤怒

大象新闻 浏览 577 08-23

“黄金+”理财热度升温,投资者如何选?

国际金融报 浏览 9101 07-24

协和医生吃了一颗头孢进抢救室:脸色发紫 当天没喝酒

人民日报健康客户端 浏览 377 09-26

哈马斯证实达成加沙停火协议

CCTV国际时讯 浏览 270 10-09

经纪人:林书豪打CBA时确实有国内球员恐吓要废了他 他有心理准备

直播吧 浏览 392 09-11

大伯晨练在公园发现年轻女尸 29年后警方公布案件详情

环球网 浏览 260 01-21

亿联银行年利率4.2%3年定存被指"提前兑付" 客服回应

第一财经资讯 浏览 5981 07-10

顾客点外卖被贴条辱骂,绿茶集团:已开除涉事员工

界面新闻 浏览 450 09-09

英国研究显示人类与自然的联结度220年来下降超60%

澎湃新闻 浏览 10425 08-10

纳瓦拉同平台/油耗6.8L 郑州日产金锐骐上市8.68万元起

网易汽车 浏览 249 01-14

美媒称沙特强烈游说特朗普对伊朗动手 沙特坚决否认

环球时报国际 浏览 178 03-03

遭枪杀工人女儿:他本打算不干了 出事后钱包仅剩2元

大象新闻 浏览 8897 08-09

“中国天眼”FAST望远镜反射面是什么形状?丨观天巨眼

中国科普博览 浏览 401 09-01

男子散步被毒蛇咬伤同行女友冷静处理 半小时送医获救

红星新闻 浏览 414 09-16

理想汽车下摆臂异响补偿方案发布月余,多位车主投诉称遭区别对待

澎湃新闻 浏览 335 09-22
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11