关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者2025-10-28 00:00:0181人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

"一霸手"管庆良获刑 曾让家人将现金埋地里再种上玉米

鲁中晨报 浏览 206 09-26

强化学习之父Richard Sutton揭示OaK架构:通向超级智能八步愿景

机器之心Pro 浏览 261 08-20

营造良好创新生态,催生更多“化学反应”

上观新闻 浏览 4027 07-13

今秋这件“瘦瘦衫”必穿!巨in巨洋气,上身瘦十斤!

Yuki女人故事 浏览 167 09-19

大众“恋战”燃油车,需要小鹏补齐智能化短板

禾颜阅车 浏览 232 08-20

短剧要翻拍《新英雄本色》,短剧一哥刘萧旭主演,海报有内味儿

最爱酷影视 浏览 116 10-12

见鬼了!虞书欣红毯艳压迪丽热巴?看见生图我笑了

Yuki女人故事 浏览 318 08-21

晚点独家丨大定突破今年4万产能上限,新ES8帮蔚来赢得更多机会

晚点LatePost 浏览 172 09-22

黄仁勋,亲赴台积电“要产能”

华尔街见闻官方 浏览 53 11-10

中国电动汽车投资格局生变,海外超国内

盖世汽车 浏览 265 08-23

波音复苏现曙光

北京商报 浏览 9730 07-31

李迅雷:黄金暴涨、股市波动,普通人机会在哪?

首席经济学家论坛 浏览 112 10-20

伊姐周六热推:电视剧《十二封信》;电影《死神来了:血脉诅咒》......

伊周潮流 浏览 160 08-31

从灶台到屏幕:一位餐饮老炮的抖音破局之路

餐饮老板内参 浏览 264 08-26

赵勇谈中国女排再次逆转:为全队感到骄傲,总决赛会全力以赴准备

直播吧 浏览 7472 07-14

记者:切尔西即将回应库库的报价;球员渴望与C罗并肩作战

懂球帝 浏览 7454 07-28

武大医学生飞机上救人学校发文表扬 当事人:不后悔

潇湘晨报 浏览 8359 07-28

美卫星照片披露:俄核潜艇基地在强震中受损

红星新闻 浏览 3923 08-06

2025浦江创新论坛发布超1万项技术需求

新华社 浏览 162 09-21

陈伟霆无预警官宣结婚生子,与何穗相恋6年终圆满,众星发声祝福

扒虾侃娱 浏览 102 10-18

新消费周报 | 美团京东启动万店计划;叮咚买菜正式发布“4G”战略;胖东来计划开发奶制品

第一财经商业数据中心 浏览 3395 07-27
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11