关闭广告

让AI看懂长电影,这位准博士生想找到智能的真实边界

DeepTech深科技2025-08-11 00:00:027958人阅读

Next Gen

欢迎来到“Next Gen”。人工智能的边界每日都在被拓展,一群富有远见卓识的青年学者正站在浪潮之巅。我们追踪并报道这些 AI 领域最具潜力的明日之星,展现他们在科研前沿的突破性工作,以及对未来智能时代的独到见解。他们是谁?他们如何思考?他们又将把 AI 带向何方?与我们一同发现那些正在定义未来的 AI 新生代。

“我觉得 benchmark 要么你足够难,难到模型都没办法解决,要么你足够贴近现实生活。”

当 OpenAI 的 o4-mini-high、Google 的 Gemini 2.5 Pro 等前沿模型在困难编程题上集体拿到 0 分时,这条标准被直观地验证了。给出这组让人意外的成绩,是LiveCodeBench Pro——一个由普林斯顿大学准博士生柴文浩与团队构建的算法竞赛基准。


图丨柴文浩(来源:柴文浩)

出身数学竞赛的柴文浩,正用自己的视角重估 AI 能力的真实边界

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

辽宁旧将回收营?山东寻求签辽宁3连冠FMVP弗格 效仿昔日签哈德森

醉卧浮生 浏览 3725 07-27

牵手阿里巴巴,余杭又有新布局!

都市快报橙柿互动 浏览 159 09-21

说一个令很多人不安的事:比亚迪,越来越像理想了

小李车评李建红 浏览 103 10-17

女子买房遇"非正常死亡"事件 卖家:死者自愿离开世界

环球网资讯 浏览 56 11-08

温哥华白浪总监:穆勒加盟是因为俱乐部本身,城市环境因素也存在

直播吧 浏览 5213 08-13

电池都能紧急弹射了,什么时候整拦截技术?

汽车公社 浏览 144 09-28

俄方表态"北约已实际参战" 普京不忍了谈判按下暂停键

文雅笔墨 浏览 228 09-17

娃哈哈员工:杜建英2000年已是"二把手" 能拍板很多事

江西广播电视台都市现场 浏览 13267 07-17

今年来,全市场已经有28只翻倍基

炒基蛋 浏览 220 09-02

26岁河北小伙考上加拿大公务员 当事人:领导非常客气

极目新闻 浏览 1946 07-15

成都百亿低空独角兽,要去IPO了

投中网 浏览 2961 07-16

24岁女游客漂流遇暴雨失联超3天 亲属:被救起又跌落

红星新闻 浏览 8150 07-31

黄杨钿甜事件通报!耳环是假货父亲两项违规,母亲受访称好友相送

萌神木木 浏览 2471 07-17

NASA叫嚣美国"一定会在中国之前登月" 前局长当众拆台

枢密院十号 浏览 247 09-15

铁威马推出 F2-425 双盘位 NAS:英特尔 N5095,单 2.5GbE 网口

IT之家 浏览 4620 08-13

不愧牛市!证券公司赚疯了,有人利润翻5倍

说财猫 浏览 64 11-03

PD-1 PLUS成主角?国产创新药再迎催化 这场顶级肿瘤学会议值得关注

财联社 浏览 5866 08-10

希拉里干女儿嫁给“顶流资本” 分享250亿金融帝国

上游新闻 浏览 9373 07-13

苹果iOS 26公测版来了,2013年来最大界面改版

华尔街见闻官方 浏览 1346 07-25

56岁解晓东黄山被偶遇,走路晃肩严重

观察鉴娱 浏览 303 08-19

杨毅旧言论:威少纯粹就是靠身体打球 身体下降对他影响很大

直播吧 浏览 175 09-09
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11