关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者2025-10-28 00:00:0187人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

放弃实体SIM卡的iPhone能买吗:三大运营商均推进,联通用户或成首批尝鲜者

红星资本局 浏览 202 09-11

上海AIGC创作者论坛成功举办,IPSH发布全球伙伴计划

澎湃新闻 浏览 157 09-29

山东大爷被"孙子"骗8万一直恼火 半年多后"反杀"成功

扬子晚报 浏览 1047 07-21

“白酒教父”吴向东要做啤酒,珍酒李渡股价逆势大涨

达摩财经 浏览 5399 08-07

中俄朝三国领导人将首次一起公开亮相

扬子晚报 浏览 173 08-30

鲍文:两场比赛西汉姆就丢了8个球,作为队长我对开局感到愤怒

直播吧 浏览 255 08-23

进苏超决赛,泰州主帅:队伍分工明确,三个臭皮匠顶个诸葛亮

懂球帝 浏览 84 10-23

航班提前15小时起飞 龙江航空致歉

新京报 浏览 152 09-29

143亿!英伟达AMD联手投出史上最大种子轮

智东西 浏览 3829 07-16

想抄中国剧本?“美国都放弃40年了,抄都不会抄”

观察者网 浏览 132 09-26

又嫁错人?贾静雯老公过往争议被扒,催生四胎还和老婆闺蜜搞暧昧

萌神木木 浏览 112 10-22

互联网大厂反腐仍“在路上”:有基层员工违法获利上亿元

澎湃新闻 浏览 5502 07-27

TA:布莱顿也有意乔-戈麦斯但时间不够,球员愿意留在利物浦

懂球帝 浏览 223 09-02

妈妈为娃入学掏空480万买房结果悲催 上家说她记错了

新民晚报 浏览 1214 07-16

无人机飞手培训教室爆满:有60岁学员 25天费用达2万

封面新闻 浏览 7463 07-26

孙颖莎1比3不敌队友陈熠 爆冷出局无缘8强

人民日报 浏览 6277 07-11

宝马五门电动掀背车 i1 非官方效果图曝光,预估 2028 年推出

IT之家 浏览 154 09-20

小米汽车 10 月交付量超过 40000 台

IT之家 浏览 73 11-01

增程动力/20万级 iCAR V27要做年轻人第一台"卫士"

网易汽车 浏览 282 05-22

风云起,美国又来了!针而对之小圈子呼之欲出

浏览 7768 07-14

谈判数月后 特朗普称即将与哈佛敲定协议

大象新闻 浏览 193 10-02
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11