关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者2025-10-28 00:00:0110人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

宇航员在火星失联受伤咋办?美国宇航局携手谷歌打造太空版AI医生

IT之家 浏览 7037 08-09

91岁阿玛尼离世,众星发文悼念,一生无子嗣

小椰的奶奶 浏览 150 09-06

抢先看:60秒混剪盛大阅兵训练

人民日报 浏览 98 08-28

有车企宣布:全额补贴豪车税!保时捷遭抢购,“店员已忙疯”

21世纪经济报道 浏览 10358 07-21

波兰不堪压力放行中欧班列 敲中国竹杠被中方反"教育"

现代小青青慕慕 浏览 121 09-26

小区为广场舞人群装定向音响 网友呼吁:建议全国推广

环球网资讯 浏览 761 07-26

不卖了!苦等两年无果,青海女老板怒退国资

壹只灰鸽子 浏览 6598 07-29

个人养老金新增三种领取条件!“开户热、缴费冷”有望缓解

21金融圈 浏览 228 08-21

台前舰长吕礼诗谈九三阅兵:好多装备打台湾根本用不上

环球网资讯 浏览 168 09-08

网红夫妇中丈夫患焦虑症:5年生4胎 曾称要陪妻子结扎

鲁中晨报 浏览 3090 08-07

7月国内航线机票预订量近1790万张 比去年同期增长约5%

每日经济新闻 浏览 1365 06-28

Petal One 尊享套餐用户可参与,华为 Mate XTs 发布会开启报名

IT之家 浏览 192 09-01

周定洋庆祝蓉城胜国安:完美胜利的夜晚,还有一波硬仗等着我们

直播吧 浏览 10241 07-27

以军空袭也门首都萨那 以色列多地拉响防空警报

上观新闻 浏览 95 09-26

30岁孟子义再破天花板 她让整个内娱都“沉默了”

老吴教育课堂 浏览 157 09-01

福建一村捅"博士窝"出33名博士 今年再添61名优秀学子

潇湘晨报 浏览 10242 08-22

线上服装想借品牌破局,淘宝押注“秀场”直播带货

第一财经资讯 浏览 127 09-09

惊艳亮相!歼-20S飞行员披露新变化

扬子晚报 浏览 134 09-06

49岁男子因猥亵儿童被同监室三男子打断肋骨 索赔23万

极目新闻 浏览 3444 08-12

新华保险首个中资产康养旅居社区落地开启旅居养老新范式

经理人杂志 浏览 1 10-31

Canalys:一季度阿里云继续稳居中国大陆云服务市场首位

IT之家 浏览 1736 07-15
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11