关闭广告

深夜突发!Claude Opus 4.1发布:智能体、代码、推理能力全面提升

学术头条2025-08-06 12:00:024706人阅读

Anthropic 突然发布了 Claude Opus 4.1,这是对 Claude Opus 4 在 agentic 任务、真实世界编程和推理能力上的全面升级,并称计划在未来几周内发布对模型的大幅改进。

据介绍,Claude Opus 4.1 将编码性能提升至 SWE-bench Verified 测试中的 74.5%,同时还提升了深度研究和数据分析能力,尤其在细节追踪和 agentic 搜索方面。

Anthropic 还提到了第三方合作伙伴对 Claude Opus 4.1 的真实感受。

[哇]GitHub 指出,与 Opus 4 相比,Claude Opus 4.1 在大多数能力上均有提升,其中多文件代码重构的性能提升尤为显著。
[让我看看]Rakuten Group 发现,Opus 4.1 在大型代码库中精准定位具体修正点时表现优异,不会进行不必要的调整或引入 bug,他们更倾向于在日常调试任务中使用这种精准度。
[强]Windsurf 报告称,Opus 4.1 在其初级开发者基准测试中较 Opus 4 提升了一个标准差,与从 Sonnet 3.7 到 Sonnet 4 的性能飞跃大致相当。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

美记:小托马斯对篮网不给2000万年薪长约沮丧 他或接受资质报价

直播吧 浏览 3029 07-25

一年三递表!同仁堂医养能喝下上市这碗「补药」吗?

节点财经 浏览 5827 07-12

恭喜!浙江队外援卢卡斯社媒晒照,与妻子迎来二胎

直播吧 浏览 1418 07-16

AI竞技场,归根到底只是一门生意

锦缎研究院 浏览 3089 08-06

特斯拉智能辅助驾驶里程已超100亿公里

大象新闻 浏览 41 11-27

六年来首次!OpenAI新模型开放权重,Altman称为“全球最佳开放模型”

华尔街见闻官方 浏览 2369 08-06

习水多名儿童疑吃三明治中毒 有孩子一天拉肚子三十次

极目新闻 浏览 189 09-22

1.2亿辆车被召回,超半数源于监管调查,车企自查缺陷就这么难?

DearAuto 浏览 108 10-22

王晶爆成龙被扇耳光,说刘亦菲没天赋

界史 浏览 1512 07-12

72岁赵雅芝1588生日会门票秒没,网友:人傻钱多

港剧叔 浏览 101 10-19

弗兰克:要做到攻守平衡,巴黎是欧洲最佳但热刺希望赢得欧超杯

直播吧 浏览 7701 08-12

英伟达市值突破4.1万亿美元,美国政府已批准H20的出口申请,黄仁勋:对可以开始向中国发货感到高兴

东方网 浏览 3004 07-16

外媒:黄仁勋将在北京举行媒体吹风会

参考消息 浏览 8971 07-14

深挖|辛芷蕾:她的野心人尽皆知,多好

锋哥与八卦哥 浏览 219 09-09

魅族 22 配备超声波指纹、隐藏式红外智控,号称“细节不将就”

IT之家 浏览 208 09-11

再也不怕面瘫脸!YouTube黑科技:AI帮你「永久微笑」,连僵尸都咧嘴笑

新智元 浏览 209 09-09

"山姆下架好丽友派"吵上热搜 盼盼洽洽改用英文名上架

每日经济新闻 浏览 1622 07-16

“具身赋能,智造未来”论坛暨新品发布会成功举办

环球网资讯 浏览 5815 07-28

迈阿密国际2-1纳什维尔,梅西双响,苏亚雷斯搓射空门不进

懂球帝 浏览 2441 07-13

WAIC前线|声网发布新版对话式 AI 引擎,集成声纹识别、数字人与视觉理解功能

网易科技报道 浏览 6303 07-29

萧华:对罗齐尔和比斯利的调查仍在进行中 联盟将始终予以配合

直播吧 浏览 2006 07-16
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11