关闭广告

Claude Opus 4.5来了!单次生成打造《我的世界》,还破解高难度Agent测评

智东西2025-11-25 12:00:0136人阅读

智东西
作者 陈骏达
编辑 李水青

智东西11月25日报道,今天,Anthropic发布了自家的旗舰编程模型Claude Opus 4.5。Anthropic称,这是全球范围内在编程、agents和计算机使用方面最强大的模型。

在真实世界软件工程测试SWE-bench Verified中,Claude Opus 4.5成为首款得分超过80%的AI模型,不仅领先于自家的Claude Sonnet 4.5,还超过了上周发布的Gemini 3 Pro和GPT-5.1 Codex-Max。


Anthropic还把该公司面试人类工程师的高难度居

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

里奇-保罗:当詹姆斯退役后,媒体就会找到新的大反派去攻击

懂球帝 浏览 2561 07-16

AI,还有一个大漏!

市值Observation 浏览 10348 07-25

A股投资“稳定币”一个不错的渠道

阿尔法工场 浏览 200 09-09

镜报:阿联酋财团准备收购曼联股份,小贝或任此次收购代言人

懂球帝 浏览 109 10-20

他是央视“学历最高”男主持,被称倪萍接班人?

石场阿鑫 浏览 226 09-06

冰淇淋滞销,5毛冰棍越卖越亏,贵价gelato也卷不动

每日人物 浏览 8978 07-22

乌被指要俄"全额赔偿战时损失" 还给出具体的支付方案

红星新闻 浏览 298 08-20

普京与金正恩通电话

新京报 浏览 7245 08-13

男子买手机不久屏幕有黑点换后又花屏 荣耀:再换付费

大风新闻 浏览 10298 07-11

Stellantis警告:欧洲汽车产业面临崩溃危机,减排法规亟需修订

IT之家 浏览 201 09-09

跨时代的武侠视觉巨制,今晚迎来告别放映!

幕味儿 浏览 18 12-11

散户疯狂、科技巨头分化,AI推动的美股牛市到顶了吗?

钛媒体APP 浏览 8762 08-06

美国政府联手苹果、微软、OpenAI等公司,招募1000名工程师打造"科技力量"

华尔街见闻官方 浏览 5 12-16

美媒盘点那些“重回母队”的球星:詹韦领衔+韦伯绕了一大圈

直播吧 浏览 272 08-24

哪吒汽车正式被申请破产

电动知家 浏览 255 06-23

BBC:努诺与诺丁汉森林老板关系破裂,帅位并不稳固

直播吧 浏览 218 08-23

AI领域为何成全球反垄断执法的新战场?监管利剑指向何方?

南方都市报 浏览 6879 07-25

限时7.99万元起 瑞虎7 PLUS&瑞虎7高能版焕新上市

网易汽车 浏览 7292 06-23

AVX-512 将重返英特尔 CPU,和 AMD 展开性能对决

IT之家 浏览 8124 08-07

“绯闻天王”黎明,抛弃舒淇、为前妻豪掷数亿

归史 浏览 10148 07-13

阿娇独居北京三居室,44岁仍想怀孕生子

阿废冷眼观察所 浏览 7715 07-12
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11