关闭广告

多模态大模型学会回头「看」:中科院自动化所提出GThinker模型

机器之心Pro2025-07-21 12:00:029562人阅读



尽管多模态大模型在数学、科学等结构化任务中取得了长足进步,但在需要灵活解读视觉信息的通用场景下,其性能提升瓶颈依然显著。现有模型普遍依赖基于知识的思维模式,却缺乏对视觉线索的深度校验与再思考能力,导致在复杂场景下频繁出错。

为解决这一难题,来自中科院自动化研究所紫东太初大模型研究中心的研究者提出 GThinker,一个旨在实现通用多模态推理的新型多模态大模型。

GThinker 的核心在于其创新的「线索引导式反思(Cue-Guided Rethinking)」模式,它赋予了模型在推理过程中主动校验、修正视觉理解的能力。

通过精心设计的两阶段训练流程,GThinker 在极具挑战性的 M³CoT 综合推理基准上取得了超越了最新的 O4-mini 模型,并在多个数学及知识推理榜单上展现出 SOTA 性能,证明了该方法的有效性和泛化能力。目前,论文、数据及模型均已开源。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

中国联通上半年业绩:营收净利增速显著放缓,但多项指标居于行业首位

时代周报 浏览 6700 08-14

三星时隔七年重启 Z-NAND 技术:目标是 NVMe SSD 约 15 倍性能

IT之家 浏览 5408 08-11

辛芷蕾获影后不到24小时 令人恶心的一幕就发生了

农城浪子 浏览 168 09-11

曹云金直播悼念杨少华,得知噩耗深感痛惜:我们也曾模仿他

扒虾侃娱 浏览 8731 07-10

老人骑电动车被撞后身亡 司机上诉:96.8公斤属机动车

红星新闻 浏览 5615 08-13

多家绿茶餐厅撤下"现点现做"招牌 餐具上字眼也被涂黑

大象新闻 浏览 123 09-18

外媒:美对加拿大加征35%关税 无疑是"一记重击"

环球时报国际 浏览 6567 07-13

新季各队最令人期待球员中部篇 内姆哈德追逐MIP?

体坛周报 浏览 122 09-22

女生胸部最标准的5个形状(男生禁入!)

Yuki女人故事 浏览 9656 07-01

曼联签新卡里克没7000万拿不下,今夏恐已无缘!拉爵重点将先卖人

罗米的曼联博客 浏览 214 08-19

金山云(KC.US)携6大AI创新成果亮相WAIC

智通财经 浏览 2639 07-27

又嫁错人?贾静雯老公过往争议被扒,催生四胎还和老婆闺蜜搞暧昧

萌神木木 浏览 38 10-22

推广|| 今年最火的单品!既时髦又有好运加持,入股不亏

黎贝卡的异想世界 浏览 131 09-09

韦尔谈被斯波批评:我将其视为一种激励 他希望我发挥出最佳水平

直播吧 浏览 2834 07-15

数百犹太裔知名人士签署公开信:呼吁制裁以色列

环球时报国际 浏览 25 10-25

美国国务院裁员15%:“所有美国人都将为此付出代价”

国际金融报 浏览 7562 07-13

女子遭电诈拟寄400克黄金 警方发紧急"寻人启事"刷屏

红星新闻 浏览 7947 07-14

销量持续回暖,谁说燃油车不行了?

汽车公社 浏览 49 10-14

中国核聚变技术获国际原子能机构肯定,“环流三号”亮相聚变能国际大会

上观新闻 浏览 40 10-20

百度蒸汽机视频大模型7折价入局

北京商报 浏览 196 08-22

自研AI进展缓慢,苹果被曝已就收购Mistral、Perplexity进行讨论

IT之家 浏览 188 08-27
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11