关闭广告

Claude Opus 4.5来了!单次生成打造《我的世界》,还破解高难度Agent测评

智东西2025-11-25 12:00:01212人阅读

智东西
作者 陈骏达
编辑 李水青

智东西11月25日报道,今天,Anthropic发布了自家的旗舰编程模型Claude Opus 4.5。Anthropic称,这是全球范围内在编程、agents和计算机使用方面最强大的模型。

在真实世界软件工程测试SWE-bench Verified中,Claude Opus 4.5成为首款得分超过80%的AI模型,不仅领先于自家的Claude Sonnet 4.5,还超过了上周发布的Gemini 3 Pro和GPT-5.1 Codex-Max。


Anthropic还把该公司面试人类工程师的高难度居

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

泰方称落入老挝境内炮弹系柬埔寨发射 柬国防部谴责

环球网资讯 浏览 10148 07-27

PPE架构打造 曝保时捷CayenneCoupe EV谍照

车质网 浏览 8621 07-28

胡塞武装发出警告 以色列承认索马里兰搅动红海棋局

上观新闻 浏览 187 12-31

不顾警告与刘涛传出绯闻的杨烁,到底谁在给他撑腰?

二妹扯娱 浏览 270 11-10

痛批落马副市长的市长也落马了,你别笑

识局 浏览 197 02-03

李湘减肥成功,和女儿王诗龄一起回小区被偶遇,目测瘦了50斤!

娱乐团长 浏览 84 04-22

杨兰兰被披露的财富只是冰山一角 保镖的衣服都是名牌

星河也灿烂 浏览 10125 08-10

北京警方:无人机“黑飞”违法必担责

北青网-北京青年报 浏览 455 08-21

三星开始向旧款智能手表推送 Galaxy Watch8 新增表盘

IT之家 浏览 6623 07-12

马斯克连发13条帖文 抨击特朗普爱泼斯坦案是骗局说法

环球时报新闻 浏览 1167 07-18

8月"零小蔚"交付量均创历史新高 理想掉队

财联社 浏览 410 09-02

“移动崩了”?上班无法打卡?北京移动致歉

北青网-北京青年报 浏览 6556 08-13

一车三动力:五菱星光730电/油/插混动力配置公布,10月15日预售

IT之家 浏览 341 10-13

废了3亿,拍了内娱最大笑话

独立鱼 浏览 338 09-21

卖房炒股后,韩国股市快翻倍了

大猫财经Pro 浏览 240 01-09

女友BELLA+封面 | 高杨:步履稳定,心向未知

伊周潮流 浏览 224 11-22

端侧AI赋能千行百业 2025 Ceva技术研讨会助力产业升级

爱集微 浏览 242 11-12

新款红旗HS5曝光,内外设计大改,或推插混车型,半年内上市!

车讯简报 浏览 223 01-20

上海姑娘离婚后去冰岛买房当公务员 随心所欲追求自由

北回归线 浏览 599 09-01

早资道丨京东外卖上线自营外卖门店;去年网络文学出海市场规模超50亿元

封面新闻 浏览 3507 07-22

62岁男子被认定三项罪名获刑8年 再审减去一罪改判5年

北青深一度 浏览 4780 07-18
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11