关闭广告

GPT-5发布前夜,Anthropic抢先出牌,发布新模型Claude 4.1

网易科技报道2025-08-07 00:00:019231人阅读

8月6日消息,于本周一发布了其旗舰模型的升级版Claude Opus 4.1,该模型在软件工程任务上的表现创下新高。新发布的模型在SWE-bench Verified基准测试中取得了74.5%的得分,超过了OpenAI的o3模型(69.1%)和谷歌的Gemini 2.5 Pro(67.2%),进一步稳固了Anthropic在AI助手领域的领先地位。SWE-bench Verified是一项广泛用于测试AI系统解决真实世界软件工程问题能力的基准。

除了编码能力的提升,Opus 4.1还在研究和数据分析,特别是细节追踪和自主搜索方面有所增强。该模型继续采用混合推理架构,在处理复杂问题时能够利用多达64,000个token进行扩展思考。

与此同时,Anthropic也提升了该模型的安全等级。Opus 4.1被划入公司最高的AI安全等级3(ASL-3),要求采取更强的防护措施以防止模型被盗用或滥用。此前的测试曾显示,Claude 4系列模型在模拟场景下表现出过一些令人担忧的行为,例如以泄露个人信息作为“勒索”手段来避免被关停。

市场回响:企业热捧与开发者的审慎

尽管存在安全疑虑,企业客户的采纳热情并未减弱。GitHub方面表示,Claude Opus 4.1在多文件代码重构方面带来了“尤为显著的性能提升”;乐天集团 (Rakuten Group)则称赞该模型“能够在庞大的代码库中精准定位并修正问题”。

Anthropic聚焦开发者市场的战略已显示出强大的商业潜力。其面向企业客户的Claude Code订阅服务,月费高达200美元,在几乎没有市场推广的情况下,仅用数周时间便实现了收入翻番,目前年度经常性收入已达到4亿美元。

开发者阮明日 (

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

三星电子Q2营利骤降55% 芯片业务仍深陷增长泥潭

财联社 浏览 9778 07-31

鱼跃医疗:高管专职背后总经理却在关联方任职 孙公司或与原实控人“藕断丝连”

金证研 浏览 5019 07-18

17岁日乒一姐状态堪忧:亚锦赛再败苦主 近五战最远8强各种被逆转

颜小白的篮球梦 浏览 122 10-13

国产细胞组学 Stereo-cell 技术突破,被誉为“生命浑天仪”

IT之家 浏览 289 08-23

记者:切尔西老板对俱乐部名称与非目标球员联系在一起表示零容忍

直播吧 浏览 8854 07-25

当美国还在纠结作弊,中国已把AI列为必修课!

网易科技报道 浏览 1377 07-29

2025秋冬靴子八大流行趋势!

LinkFashion 浏览 151 09-16

曲刚:恭喜新鹏城获胜,我们需要尽快从失利中恢复过来

懂球帝 浏览 261 09-01

苹果公司发布新品

环球网资讯 浏览 200 09-10

致敬经典,夏威夷一画家在涂鸦墙画出科比08奥运噤声庆祝造型

懂球帝 浏览 225 08-26

美记:步行者想要有经验的后卫 他们与奥迪重聚的可能性越来越大

直播吧 浏览 2101 07-17

国家发催债令,严禁机关国企当“老赖”,什么信号?

智谷趋势 浏览 7751 08-09

美国政府效率部提前解散

北京商报 浏览 34 11-25

内蒙古遭遇1959年来最强降水 有游客滞留沙漠近3小时

极目新闻 浏览 3959 07-31

今年秋天,有这几件单品就够了

黎贝卡的异想世界 浏览 109 10-18

纪念抗战胜利80周年大会第一次综合演练圆满结束

新华社 浏览 23360 08-11

张艺兴单依纯都在跳,“技能五子棋”是什么?

黔乡小姊妹 浏览 103 10-11

全球知名对冲基金投资人:中国业务超越预期

中国基金报 浏览 36 11-25

不只H20?黄仁勋:希望对华销售更好的芯片

网易科技报道 浏览 841 07-17

游客称武大共享电动车每小时要33元 运营商:校方同意

扬子晚报 浏览 320 08-27

关系藏不住了?小S二女儿被曝恋情

小梊搞笑解说 浏览 110 10-16
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11