关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者2025-10-28 00:00:01295人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

被演唱会上的叶倩文惊艳

喵喵娱乐团 浏览 307 10-14

吉利ICON巧克力心动紫上市!网友:销量稳了

汽车网评 浏览 234 11-02

女生想退充电宝被多家快递拒收 快递:有3C认证也不行

都市快报橙柿互动 浏览 2226 07-09

23家湾区企业上榜世界500强,华为重回前100

21世纪经济报道 浏览 6934 07-30

切尔西与加纳乔达成协议,希望曼联降价千万!否则或改买巴萨悍将

罗米的曼联博客 浏览 4473 08-09

债基短期大跌,专家支招避险 →

国际金融报 浏览 477 08-22

父亲辞职带9岁多动症儿子徒步60天:同行还有2组家庭

潇湘晨报 浏览 314 10-15

释永信四弟释永胜被传失联 曾持有少林欢喜地股权15年

金融界 浏览 8014 07-31

奥尔特曼警告:把ChatGPT当作心理治疗师并不安全

IT之家 浏览 1455 07-26

颠覆认知!用这8把“尺子”重新丈量中国餐饮未来!

餐饮老板内参 浏览 357 09-22

俄乌第三轮谈判在即 双方代表团人员构成获披露

环球网资讯 浏览 893 07-24

美迪西子公司遭客户索赔1.59亿元,因新药项目安评报告交付滞后

红星资本局 浏览 386 09-22

中国科学院突破电解水制氢技术瓶颈,MOFs 电极实现规模化应用

IT之家 浏览 445 09-01

多只宠物中毒死亡11人提起刑附民诉讼 投毒者获刑4年

红星新闻 浏览 233 12-11

今年第三次!53万的理想MEGA烧了,奶爸:不敢想象

说财猫 浏览 271 10-25

DeepSeek、GPT-5带头转向混合推理,一个token也不能浪费

机器之心Pro 浏览 435 09-01

中国最能“薅羊毛”的县,一年狂赚130亿

正和岛 浏览 396 09-01

健康第一,卢:伦纳德目前身体状况正佳,希望他能保持住

懂球帝 浏览 318 10-11

盒马败走会员店,转向下沉市场

21世纪经济报道 浏览 6742 08-06

丽台预售英伟达桌面 AI 超算 DGX Spark:1TB SSD 款 29500 元

IT之家 浏览 10069 07-28

港股无人矿卡第一股诞生!大疆教父李泽湘敲钟,红杉百度联手押注

车东西 浏览 152 12-19
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11