关闭广告

GPT-5发布前夜,Anthropic抢先出牌,发布新模型Claude 4.1

网易科技报道2025-08-07 00:00:019407人阅读

8月6日消息,于本周一发布了其旗舰模型的升级版Claude Opus 4.1,该模型在软件工程任务上的表现创下新高。新发布的模型在SWE-bench Verified基准测试中取得了74.5%的得分,超过了OpenAI的o3模型(69.1%)和谷歌的Gemini 2.5 Pro(67.2%),进一步稳固了Anthropic在AI助手领域的领先地位。SWE-bench Verified是一项广泛用于测试AI系统解决真实世界软件工程问题能力的基准。

除了编码能力的提升,Opus 4.1还在研究和数据分析,特别是细节追踪和自主搜索方面有所增强。该模型继续采用混合推理架构,在处理复杂问题时能够利用多达64,000个token进行扩展思考。

与此同时,Anthropic也提升了该模型的安全等级。Opus 4.1被划入公司最高的AI安全等级3(ASL-3),要求采取更强的防护措施以防止模型被盗用或滥用。此前的测试曾显示,Claude 4系列模型在模拟场景下表现出过一些令人担忧的行为,例如以泄露个人信息作为“勒索”手段来避免被关停。

市场回响:企业热捧与开发者的审慎

尽管存在安全疑虑,企业客户的采纳热情并未减弱。GitHub方面表示,Claude Opus 4.1在多文件代码重构方面带来了“尤为显著的性能提升”;乐天集团 (Rakuten Group)则称赞该模型“能够在庞大的代码库中精准定位并修正问题”。

Anthropic聚焦开发者市场的战略已显示出强大的商业潜力。其面向企业客户的Claude Code订阅服务,月费高达200美元,在几乎没有市场推广的情况下,仅用数周时间便实现了收入翻番,目前年度经常性收入已达到4亿美元。

开发者阮明日 (

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

女孩患重病每天工作20个小时 曾10天收5份病危通知书

红星新闻 浏览 4319 07-21

剑南春丨曼联1-1利兹联,阿伦森破门,齐尔克泽助攻库尼亚扳平

懂球帝 浏览 213 01-05

凤凰组合2-0程星/张驰,晋级韩国羽毛球公开赛混双4强

直播吧 浏览 243 09-26

美媒:美方提出的28点新计划已缩减为19点

极目新闻 浏览 332 11-25

香港科大:用"随机策略"训练AI数学推理,效果竟然超越复杂算法

科技行者 浏览 253 10-22

男子醉驾撞死女教师获刑两年半 事发地附近有两所学校

扬子晚报 浏览 219 12-24

成绩稀烂!记者:博卡青年足球委员会解散

直播吧 浏览 3064 08-07

中金黄金股价大跌,最新回应:涉事工厂已经停产,正处理善后工作

红星资本局 浏览 10444 07-24

熊园:“十五五”GDP目标——怎么定、定多少?

首席经济学家论坛 浏览 310 10-23

净利润大跌47%!华润三九,业绩失速

侃见财经 浏览 485 08-19

马斯克的“AI女友”每月只要30美元

财视传播 浏览 4986 07-16

中国汽车产业跻身全球第二梯队,新能源领域竞争力领跑

汽湃 浏览 5689 08-05

朱光耀:中美AI实力对比,中国具备三项优势

上观新闻 浏览 209 12-21

半年亏损11.93亿美元,所以极星汽车还能活多久?

车动态 浏览 385 09-06

中东多个海水淡化厂受损 引发饮用水武器化担忧

澎湃新闻 浏览 146 03-14

2025世界人工智能大会:有关AI的三个“灵魂之问”

上观新闻 浏览 1666 07-28

与欧洲领导人通话 特朗普“言辞强硬”

环球网资讯 浏览 243 12-12

地狱笑话的背后,是新女性生存样本

时尚COSMO 浏览 4797 07-17

去年的今天:辽宁将郭艾伦的顶薪独家签约权正式转让给广州

直播吧 浏览 393 08-29

厂房沉降纠纷缠身,熊猫乳品两大募投项目延期

时代周报 浏览 237 01-08

独家 | “小妖怪”总制片人:走出“浪浪山”第一步,挣到10亿

中国企业家杂志 浏览 439 08-24
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11