关闭广告

深夜突发!Claude Opus 4.1发布:智能体、代码、推理能力全面提升

学术头条2025-08-06 12:00:024894人阅读

Anthropic 突然发布了 Claude Opus 4.1,这是对 Claude Opus 4 在 agentic 任务、真实世界编程和推理能力上的全面升级,并称计划在未来几周内发布对模型的大幅改进。

据介绍,Claude Opus 4.1 将编码性能提升至 SWE-bench Verified 测试中的 74.5%,同时还提升了深度研究和数据分析能力,尤其在细节追踪和 agentic 搜索方面。

Anthropic 还提到了第三方合作伙伴对 Claude Opus 4.1 的真实感受。

[哇]GitHub 指出,与 Opus 4 相比,Claude Opus 4.1 在大多数能力上均有提升,其中多文件代码重构的性能提升尤为显著。
[让我看看]Rakuten Group 发现,Opus 4.1 在大型代码库中精准定位具体修正点时表现优异,不会进行不必要的调整或引入 bug,他们更倾向于在日常调试任务中使用这种精准度。
[强]Windsurf 报告称,Opus 4.1 在其初级开发者基准测试中较 Opus 4 提升了一个标准差,与从 Sonnet 3.7 到 Sonnet 4 的性能飞跃大致相当。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

阿森纳前6轮拿45个角球英超最多,近三个赛季通过角球进36球

懂球帝 浏览 308 10-02

以色列警告加沙居民:只剩最后机会撤离

环球时报国际 浏览 282 10-04

创纪录的速度积累 美债总额首超37万亿美元

每日经济新闻 浏览 7455 08-13

15万预算“抄底”自主SUV 这几款车型闭眼入

独家引擎 浏览 194 01-03

香港三天两夜,满载而归(附攻略)

黎贝卡的异想世界 浏览 146 03-15

特朗普点名要"与中国有关"的英特尔CEO辞职 被指罕见

环球网资讯 浏览 7275 08-09

夏季穿搭不用发愁,这27套造型值得照搬,优雅清爽又有回头率

静儿时尚达人 浏览 381 09-07

第五代骁龙8之后,旗舰机有了新的“标准版”

科技行者 浏览 245 11-27

大因扎吉谈巴勒莫季前赛:表现很好,新赛季要用成绩回报球迷期待

直播吧 浏览 6532 07-28

北京大学重磅推出Lumen:让视频重新打光变得像换背景一样简单

科技行者 浏览 465 08-27

塞门约:目前对种族歧视采取的措施远远不够,可以考虑判刑

懂球帝 浏览 467 08-23

倪虹洁自曝:曾因前夫负债千万被迫接戏

韩小娱 浏览 106 04-09

时间的“相对论”:为什么我们总觉得时间越跑越快?『心灵加油站』(271)

我们的太空 浏览 144 12-21

旅拍这赛道,还得看倪妮

时尚COSMO 浏览 266 10-21

延续家族设计风格,或年内发布!腾势Z7内饰谍照曝光

新车评网 浏览 407 06-23

特斯拉撞树后打不开车门 5人被困燃烧的车内身亡

每日经济新闻 浏览 285 11-05

特朗普为俄乌和谈设50天期限 欧盟"外长":时间太长

环球网资讯 浏览 1086 07-16

数百大主播压阵,遥望科技为何走不出巨亏黑洞?

斑马消费 浏览 58 04-29

2026短剧出海:淘汰赛加速,谁主沉浮?

霞光社 浏览 222 01-28

被大空头狙击的明星AI股Palantir,华尔街怎么看

第一财经资讯 浏览 225 11-10

“生活不会一直都很好,但今天很好”

黎贝卡的异想世界 浏览 3796 07-06
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11