关闭广告

让AI看懂长电影,这位准博士生想找到智能的真实边界

DeepTech深科技2025-08-11 00:00:028152人阅读

Next Gen

欢迎来到“Next Gen”。人工智能的边界每日都在被拓展,一群富有远见卓识的青年学者正站在浪潮之巅。我们追踪并报道这些 AI 领域最具潜力的明日之星,展现他们在科研前沿的突破性工作,以及对未来智能时代的独到见解。他们是谁?他们如何思考?他们又将把 AI 带向何方?与我们一同发现那些正在定义未来的 AI 新生代。

“我觉得 benchmark 要么你足够难,难到模型都没办法解决,要么你足够贴近现实生活。”

当 OpenAI 的 o4-mini-high、Google 的 Gemini 2.5 Pro 等前沿模型在困难编程题上集体拿到 0 分时,这条标准被直观地验证了。给出这组让人意外的成绩,是LiveCodeBench Pro——一个由普林斯顿大学准博士生柴文浩与团队构建的算法竞赛基准。


图丨柴文浩(来源:柴文浩)

出身数学竞赛的柴文浩,正用自己的视角重估 AI 能力的真实边界

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

阿里研究:视频制作迎来"遥控器"时代,想让画面怎么动就怎么动

科技行者 浏览 209 01-05

外骨骼机器人向消费级市场拓展,傲鲨智能张华:未来它将像手机一样普及

红星资本局 浏览 517 08-11

滑翔伞飞行员被"云吸"高空背后:有机构曾提示近期天气变化

南方都市报 浏览 3420 05-30

胜利主帅谈菲利克斯:我们买的是切尔西球员,没和本菲卡抢人

懂球帝 浏览 3252 07-31

歌手陈红被前夫举报 本人回应:愿女人少些背叛与伤害

大风新闻 浏览 321 09-30

2026年央视春晚彩排开始!沈腾马丽回归,但呼声最高的是他们

娱乐圈笔娱君 浏览 203 01-07

港交所:取消中国恒大上市地位

网易财经 浏览 382 08-21

谢霆锋跟着遭殃!英皇力捧张敬轩回内地被抵制

可乐谈情感 浏览 77 04-22

塞维利亚总监:没有薪资空间引入拉莫斯,目前不考虑补强中卫

懂球帝 浏览 186 02-05

特朗普让可口可乐改配方 可口可乐公司回应

环球网资讯 浏览 4000 07-17

菲最高法院:暂停针对副总统莎拉的弹劾程序

环球网资讯 浏览 5312 07-26

2026首个巡回赛惨案诞生,萨巴伦卡化身早餐外卖员用时47分钟下班

网球之家 浏览 215 01-07

印公布首艘核动力航母研制时间表

环球网资讯 浏览 392 09-09

李想回应“再撞乘龙卡车”

电动知家 浏览 465 08-19

马斯克xAI污水处理厂破土动工,每年可为孟菲斯节约近190亿升水

IT之家 浏览 306 10-13

硅谷投资人盛赞特斯拉人形机器人:将令人忘掉特斯拉造过车

澎湃新闻 浏览 198 01-16

来北京,见证一场机器人的“狂欢”

新华社 浏览 9840 08-11

餐馆外高空坠物砸伤女子头部 社区:坠楼的是外墙瓷片

大风新闻 浏览 10391 07-23

两件大事刷屏!“924行情”即将一周年,下周市场会修复吗?

每经牛眼 浏览 353 09-22

欧尔班:乌克兰和欧盟认为匈牙利很碍事 企图更迭政府

文汇报 浏览 340 10-13

进口头孢西力欣涨价30倍!国内已停供2年,医生称非理性囤货没必要

红星资本局 浏览 241 01-07
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11