关闭广告

让AI看懂长电影,这位准博士生想找到智能的真实边界

DeepTech深科技2025-08-11 00:00:027895人阅读

Next Gen

欢迎来到“Next Gen”。人工智能的边界每日都在被拓展,一群富有远见卓识的青年学者正站在浪潮之巅。我们追踪并报道这些 AI 领域最具潜力的明日之星,展现他们在科研前沿的突破性工作,以及对未来智能时代的独到见解。他们是谁?他们如何思考?他们又将把 AI 带向何方?与我们一同发现那些正在定义未来的 AI 新生代。

“我觉得 benchmark 要么你足够难,难到模型都没办法解决,要么你足够贴近现实生活。”

当 OpenAI 的 o4-mini-high、Google 的 Gemini 2.5 Pro 等前沿模型在困难编程题上集体拿到 0 分时,这条标准被直观地验证了。给出这组让人意外的成绩,是LiveCodeBench Pro——一个由普林斯顿大学准博士生柴文浩与团队构建的算法竞赛基准。


图丨柴文浩(来源:柴文浩)

出身数学竞赛的柴文浩,正用自己的视角重估 AI 能力的真实边界

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

6个习惯正伤害你的胃

健康中国 浏览 5267 12-06

“超节点+集群”:华为撞出来的算力之路

脑极体 浏览 125 09-21

回应质疑,爱康国宾张黎刚称“别指望几百块的体检查出所有病”

尺度财经 浏览 1847 07-31

Caviar再出手:三星Galaxy Z Fold/Flip7 24K金特别版问世

IT之家 浏览 10091 07-13

安徽凭什么抢走“汽车第一省”王座?

盖世汽车 浏览 202 08-26

在去哪儿网订好机票航司却“查无此票” 平台回应

上游新闻 浏览 6845 07-20

“容嬷嬷”年轻时竟是校花?看到照片后被惊艳

富书 浏览 5560 07-27

斯瓦泰克温网夺冠后,抨击波兰媒体的苛刻对待与无休止的审视

网球之家 浏览 688 07-14

23岁小伙遇车祸去世 父母决定捐赠器官7个人同日获救

红星新闻 浏览 105 09-18

50岁的女人别乱穿衣,看看基本的穿搭法则,穿出从容与格调

静儿时尚达人 浏览 4735 07-23

法国宣布正式承认巴勒斯坦国

央视新闻客户端 浏览 93 09-24

光伏反内卷会议:细节探讨将在今明两天展开

第一财经资讯 浏览 203 08-20

普京、金正恩等将出席九三阅兵

新华社 浏览 100 08-29

公职人员干副业会成为一种趋势吗?!

识局 浏览 5753 07-30

接管家中一切!华为鸿蒙智家今日正式开售:空气、灯光、设备等统一控制

快科技 浏览 4214 07-31

麻了!天空:纽卡穷其所有签塞斯科+报价高于曼联,但他想去曼联

直播吧 浏览 6230 08-06

英伟达拟向OpenAI投资至多1000亿美元

界面新闻 浏览 106 09-23

为赶上明年去火星,SpaceX下月第十次试飞“必须成功”

网易科技报道 浏览 3183 07-31

《聊斋:小谢》选角太让人惊喜!一个甜妹,一个仙女,全是新人

温柔娱公子 浏览 2078 08-05

迈向AI汽车公司 全新小鹏P7亮相慕尼黑车展

网易汽车 浏览 143 09-09

熊友军:北京人形坚持技术创新开源开放,把最好的技术让所有人用

贝壳财经 浏览 2847 07-15
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11