关闭广告

深夜突发!Claude Opus 4.1发布:智能体、代码、推理能力全面提升

学术头条2025-08-06 12:00:026人阅读

Anthropic 突然发布了 Claude Opus 4.1,这是对 Claude Opus 4 在 agentic 任务、真实世界编程和推理能力上的全面升级,并称计划在未来几周内发布对模型的大幅改进。

据介绍,Claude Opus 4.1 将编码性能提升至 SWE-bench Verified 测试中的 74.5%,同时还提升了深度研究和数据分析能力,尤其在细节追踪和 agentic 搜索方面。

Anthropic 还提到了第三方合作伙伴对 Claude Opus 4.1 的真实感受。

[哇]GitHub 指出,与 Opus 4 相比,Claude Opus 4.1 在大多数能力上均有提升,其中多文件代码重构的性能提升尤为显著。
[让我看看]Rakuten Group 发现,Opus 4.1 在大型代码库中精准定位具体修正点时表现优异,不会进行不必要的调整或引入 bug,他们更倾向于在日常调试任务中使用这种精准度。
[强]Windsurf 报告称,Opus 4.1 在其初级开发者基准测试中较 Opus 4 提升了一个标准差,与从 Sonnet 3.7 到 Sonnet 4 的性能飞跃大致相当。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

全市场:切尔西有意金玟哉,计划将拜仁感兴趣的维加纳入交易

直播吧 浏览 2161 07-16

名记:库明加想要至少2500万年薪 勇士不愿在长约中支付如此高价

直播吧 浏览 1196 07-18

河北"巧克力钓鱼大爷"爆红:钓龄60年 有几个"黑闺蜜"

大风新闻 浏览 9056 07-19

新华社深度解读:马斯克建“美国党”背后三大推手

澎湃新闻 浏览 3319 07-12

棉密码卫生巾检出致癌物,辛选回应“合规合格”,有消费者称长期使用患结节

红星资本局 浏览 1033 07-25

不为少数人闪耀,零跑这十年为什么只做经典款?

智谷趋势 浏览 1607 07-15

主裁马宁,省长杯决赛:苏州吴县中学5-3南通海安博文高中

懂球帝 浏览 8 08-07

弗拉门戈2-1逆转布拉甘蒂诺,韦斯利-利马建功,莱奥-佩雷拉破门

懂球帝 浏览 6475 07-24

国航一航班从北京起飞1小时后返航 客服:非天气导致

红星新闻 浏览 4142 07-04

记者:德保罗将会在北美联赛杯对阵阿特拉斯时首秀

懂球帝 浏览 1979 07-17

股价重挫13%!国民饮用水怡宝业绩暴雷了

深蓝财经 浏览 1905 07-29

17岁高中生患白血病 同学病房外哭着约定等他回来

红星新闻 浏览 1248 06-16

1.2万亿投资 + 新央企加持!超级水电项目引爆市场

躺平指数 浏览 1240 07-21

夏天别总穿黑色长裤,试试这几款过膝长裙,轻盈舒适还优雅

静儿时尚达人 浏览 8503 07-07

亨德利:我认为赵心童新赛季会大放异彩,3-4个冠军头衔完全可期

直播吧 浏览 5031 07-25

15个拼多多小众宝藏好物!巨便宜巨实用,保证你买到过瘾!

Yuki女人故事 浏览 4632 06-07

释永信出事前,释小龙现身画面曝光,在园区与他人休闲打电话聊天

扒虾侃娱 浏览 989 07-30

特朗普吹嘘:我终结了伊以战争 就像广岛长崎一样

上游新闻 浏览 9326 06-26

“三七分”穿法越来越火,这样穿显高又时髦

LinkFashion 浏览 7672 07-05

MiniMax闫俊杰:AI模型将持续存在多个玩家,未来研发不再是烧钱行业

澎湃新闻 浏览 3887 07-27

大咖汇聚!解锁时尚消费密码

时尚COSMO 浏览 2040 06-17
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11