关闭广告

让AI看懂长电影,这位准博士生想找到智能的真实边界

DeepTech深科技2025-08-11 00:00:028160人阅读

Next Gen

欢迎来到“Next Gen”。人工智能的边界每日都在被拓展,一群富有远见卓识的青年学者正站在浪潮之巅。我们追踪并报道这些 AI 领域最具潜力的明日之星,展现他们在科研前沿的突破性工作,以及对未来智能时代的独到见解。他们是谁?他们如何思考?他们又将把 AI 带向何方?与我们一同发现那些正在定义未来的 AI 新生代。

“我觉得 benchmark 要么你足够难,难到模型都没办法解决,要么你足够贴近现实生活。”

当 OpenAI 的 o4-mini-high、Google 的 Gemini 2.5 Pro 等前沿模型在困难编程题上集体拿到 0 分时,这条标准被直观地验证了。给出这组让人意外的成绩,是LiveCodeBench Pro——一个由普林斯顿大学准博士生柴文浩与团队构建的算法竞赛基准。


图丨柴文浩(来源:柴文浩)

出身数学竞赛的柴文浩,正用自己的视角重估 AI 能力的真实边界

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

印度坠机事件或因副驾驶误操作 专家:副驾驶可能拉错操纵杆

极目新闻 浏览 9231 06-17

国家统计局:7月份居民消费价格同比持平

界面新闻 浏览 5899 08-10

传言落地!居然智家,危险了?

闺蜜财经 浏览 7496 07-29

白百何七百字长文控诉导演

不八卦会死星人 浏览 256 11-12

小米集团宣布最高25亿港元的自动股份回购计划并将注销

网易财经 浏览 220 01-23

夫妻网购鸡枞菌种子种出食用后严重中毒 平台:赔200元

扬子晚报 浏览 8903 07-26

彻底不装了!杜星霖怒骂73岁张纪中,体力不行脾气大 约会一身臭汗

二妹扯娱 浏览 1586 07-11

45岁潘玮柏好福气!34岁老婆宣云温柔又独立

体育小柚 浏览 220 11-11

美国将对所有赴美学生签证申请人进行网络审查

浏览 1650 08-20

反卷"同质化红海" iCAR将"风格"进行到底

网易汽车 浏览 393 09-03

贵金属风口催生7连板!白银有色涨势凌厉,基本面却“拖后腿”

览富财经网 浏览 213 01-29

极氪右转:为何回归一个吉利?

天天汽车 浏览 267 10-25

伊朗公布伊方最新谈判方案

国际在线 浏览 59 05-03

乐道L90内饰官图发布,7月10日全面到店并开启预售

皆电 浏览 3742 07-03

特朗普与泽连斯基再会面详情公开 见面就夸后者时尚

新京报政事儿 浏览 311 10-18

综合续航1730km 吉利银河M7远航家权益价10.98万起

网易汽车 浏览 64 04-29

英特尔CEO将赴白宫会晤特朗普

国际金融报 浏览 519 08-12

赵睿为地域歧视言论道歉:不该将情绪发泄球迷身上 感谢监督批评

醉卧浮生 浏览 194 02-03

美国人亲口承认:中国AI动摇美国统治根基

浏览 3405 07-14

我们复盘了会稽山的“网红路”,发现“黄酒复兴”还为时尚早

阿尔法工场 浏览 420 09-01

青年导演带你拉片,实验影像的风格化实践

幕味儿 浏览 863 07-16
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11