关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者2025-10-28 00:00:01296人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

媒体:抽烟正是导致鲁迅健康恶化最终去世的罪魁祸首

新民周刊 浏览 528 08-27

TA:维尼修斯认为自己在球队整体表现不佳的情况下被区别对待

懂球帝 浏览 217 12-23

波切蒂诺爆料:姆巴佩和梅西在巴黎踢不到一块去

体坛周报 浏览 53 05-06

英媒:如果阿森纳错过埃泽,将加大力度追求卢克曼

懂球帝 浏览 1234 08-09

Stellantis,“分”或许比“合”好

禾颜阅车 浏览 253 11-03

送别聂卫平队伍长度超200米 韩国围棋名宿前来吊唁

极目新闻 浏览 235 01-19

夏天穿衣很简单,用好黑裙、白裙,加入适当的彩色,大方自然

静儿时尚达人 浏览 4247 06-20

新增微信语音电话提醒,小米 WatchS4 41mm 开启内测特邀用户招募

IT之家 浏览 500 08-12

茅台上线淘宝闪购 计划全量上线全国6500家门店

网易科技报道 浏览 510 08-20

本以为董璇二婚会赢得大家祝福 结果遭全网劝退!

娱乐x冰淇淋 浏览 9876 07-24

伯利入主后切尔西已签47人,为同期热刺+曼城签约人数总和

懂球帝 浏览 7266 08-06

新款奔驰C级换“芯”,其余照旧

爱驾天下 浏览 472 06-12

韩星在内娱吃相越来越难看?

萌神木木 浏览 229 11-12

替补绝平海港!35岁前国脚回怼营销号侮辱:我这废物又助队拿分了

我爱英超 浏览 5779 07-27

智己“超级增程”技术及新车规划揭晓

网易汽车 浏览 803 07-22

NBA新季薪水榜:库里5960万美元连续9季第一 詹姆斯无缘前十

醉卧浮生 浏览 7808 07-29

男人至死是少年!61岁李国庆与白月光再婚

联友军事 浏览 469 08-20

以总理办公室:内塔尼亚胡28日将启程访美

上观新闻 浏览 217 12-28

“运动混搭风”今年夏天越来越流行,这样穿减龄又好看!

LinkFashion 浏览 5561 07-07

马筱梅爆料,不亲自带娃,十天后有好消息要发生

洲洲影视娱评 浏览 216 10-26

楊千嬅开live老公乱入因一事说离婚

粤睇先生 浏览 235 12-21
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11