关闭广告

深夜突发!Claude Opus 4.1发布:智能体、代码、推理能力全面提升

学术头条2025-08-06 12:00:024703人阅读

Anthropic 突然发布了 Claude Opus 4.1,这是对 Claude Opus 4 在 agentic 任务、真实世界编程和推理能力上的全面升级,并称计划在未来几周内发布对模型的大幅改进。

据介绍,Claude Opus 4.1 将编码性能提升至 SWE-bench Verified 测试中的 74.5%,同时还提升了深度研究和数据分析能力,尤其在细节追踪和 agentic 搜索方面。

Anthropic 还提到了第三方合作伙伴对 Claude Opus 4.1 的真实感受。

[哇]GitHub 指出,与 Opus 4 相比,Claude Opus 4.1 在大多数能力上均有提升,其中多文件代码重构的性能提升尤为显著。
[让我看看]Rakuten Group 发现,Opus 4.1 在大型代码库中精准定位具体修正点时表现优异,不会进行不必要的调整或引入 bug,他们更倾向于在日常调试任务中使用这种精准度。
[强]Windsurf 报告称,Opus 4.1 在其初级开发者基准测试中较 Opus 4 提升了一个标准差,与从 Sonnet 3.7 到 Sonnet 4 的性能飞跃大致相当。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

分开十年,江疏影事业感情受挫 胡歌却走上坡路

小丸子的娱乐圈 浏览 5052 07-26

突发!国寿又要清仓式减持杭州银行,或套现8.6亿元

财通社 浏览 4207 07-16

老人去银行存款结果办成保险:随后2年要缴20多万保费

大风新闻 浏览 267 08-21

从9亿诈骗案到短剧女主,王丽坤的逆袭比剧情更精彩!

Yuki女人故事 浏览 7665 08-13

“野模”孙怡人设崩塌!吃相难看,知三当三?

小杨侃事 浏览 284 08-20

加沙城民众生计仍然艰难 天气与蚊虫也成威胁

极目新闻 浏览 84 10-26

《阿凡达3》票房预估214亿,195分钟一刀不剪,力争影史第一

娱乐圈笔娱君 浏览 23 12-05

内娱女明星手撕导演,翻车了?

独立鱼 浏览 41 11-12

嘴硬?谷歌CEO首次正面回应AI人才战:上头条的都是个案!

智东西 浏览 5613 07-25

西媒:西甲裁判将首度解释比赛争议判罚,9月9日后实施

直播吧 浏览 266 08-23

易会满被查 中国证监会:坚决拥护党中央决定

北京日报客户端 浏览 189 09-07

深圳机场称台风“韦帕”或将影响飞机起降 珠海取消多趟航班

南方都市报 浏览 2803 07-20

修杰楷承认逃兵役!曾花钱造出假病历,贾静雯回应称孩子受到惊吓

萌神木木 浏览 102 10-22

睡觉时张口呼吸能用胶布封嘴吗

网易健康 浏览 3650 02-26

金价持续调整,投资者该入局吗?

国际金融报 浏览 2120 07-13

五角大楼启动10亿美元新计划 采购数十万架单向攻击无人机

环球网资讯 浏览 15 12-04

特朗普被指为"大而美"法案通宵拉票:打20小时电话游说

红星新闻 浏览 3453 07-05

小鹏汽车Q1财报发布,明确盈利时间,但仍需面临长期挑战!

百姓评车 浏览 276 05-23

新能源,重新开干!

市值Observation 浏览 3560 07-29

增配置降价格 取消Pro车型 理想i8统一配置版本

网易汽车 浏览 10317 08-06

上海这条弄堂有看头!机器人在这里才艺比拼、技能比武

文汇报 浏览 3239 07-26
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11