关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者2025-10-28 00:00:01294人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

记者:伊萨克已抵达纽卡训练基地,埃迪-豪准备与他谈话

懂球帝 浏览 7788 08-07

林诗栋连续两站输外战,美国大满贯输张本智和,今天输邱党

直播吧 浏览 10456 08-09

零跑90万台交付:新势力如何在存量竞争中突围?

节点财经 浏览 452 08-23

极速养成“四力” 我在长春航展“追”飞机丨去现场做原创

封面新闻 浏览 275 11-08

阿什拉夫:我认为我值得金球奖,我的数据不是普通后卫能做到的

直播吧 浏览 520 08-11

白血病居儿童癌症之首,但并非不治之症

网易健康 浏览 9661 06-03

拉波尔塔:这场胜利来得正是时候;亚马尔一如既往地出色

懂球帝 浏览 272 11-11

曾炒到1600元/粒的"中药茅"大跌价 公司市值蒸发1800亿

每日经济新闻 浏览 267 10-26

21-15,21-8!石宇奇轻松晋级中国公开赛八强,下轮上演国羽内战

全景体育V 浏览 7287 07-25

贾健旭力压余承东,BBA 又疯狂躺枪了

autocarweekly 浏览 360 09-25

前总裁起诉申通快递,要求分得前妻名下2028万股股权

YOUNG财经 浏览 221 01-23

NBA生涯最后一场比赛!沃尔12投6中&三分4中2 得到16分7板4助1断

直播吧 浏览 486 08-20

邮报:利物浦前员工涉及多年球票欺诈勾结黄牛牟利,审判已开始

懂球帝 浏览 268 11-01

美军损失11架"死神"无人机 特朗普为卖它曾欲改其分类

红星新闻 浏览 179 03-11

半年亏超18亿!广汽全面进入“战时状态”

国际金融报 浏览 3258 07-18

2026 款岚图梦想家 MPV 全球首搭华为乾崑 ADS 4 + 鸿蒙座舱 5

IT之家 浏览 450 08-23

意媒:费内巴切有意老将桑切斯,乌迪内斯要求买断剩余一年合同

直播吧 浏览 9921 07-14

于正曝吴谨言被女明星换角:半年苦熬只拿5000块

探长影视解说 浏览 9945 07-25

陈伟霆透露何穗生产过程经历,坦言不太顺利

今古深日报 浏览 67 04-29

上半年房地产开发投资同比降11.2%

国家统计局 浏览 3809 07-15

消息称华为首款星闪耳机 FreeBuds Pro 5 可实现全链路无损传输

IT之家 浏览 288 11-06
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11