关闭广告

让AI看懂长电影,这位准博士生想找到智能的真实边界

DeepTech深科技2025-08-11 00:00:028159人阅读

Next Gen

欢迎来到“Next Gen”。人工智能的边界每日都在被拓展,一群富有远见卓识的青年学者正站在浪潮之巅。我们追踪并报道这些 AI 领域最具潜力的明日之星,展现他们在科研前沿的突破性工作,以及对未来智能时代的独到见解。他们是谁?他们如何思考?他们又将把 AI 带向何方?与我们一同发现那些正在定义未来的 AI 新生代。

“我觉得 benchmark 要么你足够难,难到模型都没办法解决,要么你足够贴近现实生活。”

当 OpenAI 的 o4-mini-high、Google 的 Gemini 2.5 Pro 等前沿模型在困难编程题上集体拿到 0 分时,这条标准被直观地验证了。给出这组让人意外的成绩,是LiveCodeBench Pro——一个由普林斯顿大学准博士生柴文浩与团队构建的算法竞赛基准。


图丨柴文浩(来源:柴文浩)

出身数学竞赛的柴文浩,正用自己的视角重估 AI 能力的真实边界

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

美媒承认乌重镇即将被攻克:俄方为此付出了很大代价

环球时报国际 浏览 276 11-10

梁衍波当选青农商行董事长

21金融圈 浏览 214 02-05

业内人士:浮选槽矿浆是有腐蚀性的"泥石流" 很难生还

大象新闻 浏览 7834 07-24

OpenAI罕见开源两款模型,奥特曼:这是耗费数十亿美元的成果

网易科技报道 浏览 6904 08-06

弃理从文,他走出不同寻常的电影路

幕味儿 浏览 268 10-28

一组数字告诉你:三餐怎么吃营养又健康

人民网 浏览 8951 06-03

英伟达让部分零部件供应商暂停生产H20芯片 中方回应

澎湃新闻 浏览 532 08-23

伊朗被指愿作出让步:将最高丰度浓缩铀的一半送至国外

环球网资讯 浏览 208 02-24

中马智库机构在吉隆坡举行交流座谈 探讨区域研究与合作

BT财经 浏览 153 03-11

穆西亚拉评心目中年度蓝阵容:巴黎五人入选,队长选择凯恩

懂球帝 浏览 245 01-13

E句话| 邢菲为违反交通规则道歉了?

仙女事件簿 浏览 161 11-25

多伦多大师赛:布云朝克特0-2不敌索内戈,无缘32强

懂球帝 浏览 7006 07-31

奥迪A5L Sportback限定版上市 售33.49万元

车质网 浏览 154 12-15

"沈阳造"水上电动飞机完成交付前试飞

金台资讯 浏览 512 08-23

海南华铁“失算”疑云:36.9亿元“三无”合约终止,阿里云前高管参与,“牛散”结伴进退

证券时报e公司 浏览 284 10-13

AI跨步进入“经验时代”

华尔街见闻官方 浏览 400 09-11

美卫星照片披露:俄核潜艇基地在强震中受损

红星新闻 浏览 4196 08-06

穿出巴黎女人的姿态,要几步?

时尚COSMO 浏览 170 03-11

“批评是工作的一部分”:前里尔球员卡巴耶谈其在巴黎圣日耳曼的处境

绿茵情报局 浏览 108 04-10

日本首相石破茂重申留任意向

新华社 浏览 4622 07-24

净利下跌73%,市值蒸发三分之二,洽洽食品能否重拾王座?

博望财经 浏览 432 08-26
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11