关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者2026-01-29 00:00:01205人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

媒体:34岁印度穆斯林后裔拿下纽约 令特朗普感到畏惧

南风窗 浏览 274 11-12

广东三外配置太完美!奎因萨姆纳双能卫猛攻,萨林杰关键球收割!

篮球资讯达人 浏览 241 01-08

全力向上!重庆铜梁龙赛季最后一个主场将展示全场拼图TIFO

懂球帝 浏览 272 10-28

800名核心员工谁先富?千亿联影医疗5大股权激励平台同步减持!

野马财经 浏览 10118 08-10

豫媒:河南队泰国拉练只花了15万元,在当地踢热身赛一胜一平

懂球帝 浏览 210 12-05

保时捷战略调整:加码内燃机车型 电动化进程放缓

网易汽车 浏览 379 09-23

400亿市值光伏龙头,上半年亏损扩大

华美财经 浏览 447 08-23

身家10亿起的阿里码农,转投杭州科技新秀

21财闻汇 浏览 404 08-21

对话工程院院士王浩:我国独创的“河湖长制”值得向“全球南方”国家推广

封面新闻 浏览 331 10-28

环卫工翻垃圾找手表当事游客被传是法院干部 官方辟谣

纵览新闻 浏览 1459 07-15

队记:担心杨瀚森的力量不能保证他在面对NBA的内线时持续得分

直播吧 浏览 379 09-21

覆盖20-100万 鸿蒙智行携多款新车亮相成都车展

网易汽车 浏览 434 09-02

墨西哥总统宣布将向古巴提供援助并推动恢复石油供应

上观新闻 浏览 203 02-02

今日热点:阚清子官宣怀孕;李宇春巡演官宣……

伊周潮流 浏览 3085 07-26

豪车税新规来了保时捷掀抢购潮 销售:晚买1天贵十几万

每日经济新闻 浏览 5030 07-19

和陈赫离婚10年,许婧一张照片撕开婚姻的伪装

橙星文娱 浏览 382 09-10

匈牙利总理:特朗普将冯德莱恩“当作早餐吃掉了”

央视新闻客户端 浏览 965 07-29

何小鹏:“如果你想害一个哥们,你就劝他去造车吧” 小鹏汽车曾一年换十余名高管

红星资本局 浏览 455 08-27

曾经风光的7位香港外籍明星:有人已离世,有人在好莱坞当替身

娱乐白名单 浏览 6408 07-26

特斯拉FSD在美国未能有效吸引潜在买家

盖世汽车 浏览 439 09-08

内推前任成了最时髦的恋爱运动

虎嗅APP 浏览 5949 07-27
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11