关闭广告

多模态大模型学会回头「看」:中科院自动化所提出GThinker模型

机器之心Pro2025-07-21 12:00:029828人阅读



尽管多模态大模型在数学、科学等结构化任务中取得了长足进步,但在需要灵活解读视觉信息的通用场景下,其性能提升瓶颈依然显著。现有模型普遍依赖基于知识的思维模式,却缺乏对视觉线索的深度校验与再思考能力,导致在复杂场景下频繁出错。

为解决这一难题,来自中科院自动化研究所紫东太初大模型研究中心的研究者提出 GThinker,一个旨在实现通用多模态推理的新型多模态大模型。

GThinker 的核心在于其创新的「线索引导式反思(Cue-Guided Rethinking)」模式,它赋予了模型在推理过程中主动校验、修正视觉理解的能力。

通过精心设计的两阶段训练流程,GThinker 在极具挑战性的 M³CoT 综合推理基准上取得了超越了最新的 O4-mini 模型,并在多个数学及知识推理榜单上展现出 SOTA 性能,证明了该方法的有效性和泛化能力。目前,论文、数据及模型均已开源。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

没篮没串联的后卫?7号秀费尔斯21中5拿到15分2篮板 0助攻

直播吧 浏览 3513 07-13

比亚迪方程豹钛7首台量产车下线,四季度上市

三言科技 浏览 503 08-11

印度未发现波音787机队有重大缺陷

界面新闻 浏览 9224 06-19

2025年最烂大街的6套穿搭!看看你踩雷了吗?

Yuki女人故事 浏览 4007 07-27

20万手术费赎不回身陷缅甸的儿子 患癌母亲哭瞎左眼

封面新闻 浏览 556 08-22

黄仁勋现身北京?与雷军合影曝光

网易科技报道 浏览 1800 07-15

张家界荒野求生比赛还剩15人 男子靠"续命三件套"出圈

极目新闻 浏览 244 11-11

中美就TikTok等经贸问题在西班牙马德里举行会谈

新华社 浏览 413 09-16

别小看这几小事,坚持到过年那状态得有多好啊?

黎贝卡的异想世界 浏览 202 01-16

张博源在美融入不错!爆发冲突队友积极护住,球队地位也高!

篮球资讯达人 浏览 316 10-02

今年秋冬最时髦的穿法:长外套+长裤,太高级了!

LinkFashion 浏览 291 10-27

“多核驱动”,阿里巴巴正组成史上最强高管阵容

砺石商业评论 浏览 5609 07-23

大金晒出对话录屏!许凯承认动手家暴

萌神木木 浏览 468 08-23

国产EDA重磅并购案终止!华大九天交易折戟,芯和要独立上市?

时代周报 浏览 6922 07-12

罗马仕回应称运营仍在岗,员工:确实有负责召回的人员在工作

红星资本局 浏览 2841 07-16

内装豪华感提升 小鹏X9增程版内饰发布

网易汽车 浏览 300 10-26

一个呼吸让全网心跳漏拍,连刘亦菲也是迷妹,这位巨星花期不要太长!

黎贝卡的异想世界 浏览 3727 07-17

阿维塔上市、深蓝融资 长安两大自主板块剧变

道哥说车 浏览 223 12-02

惊艳!AI让400岁国宝《坤舆万国全图》“活”起来了

文汇报 浏览 5434 07-26

广西平果球员:俱乐部没找我们签字,解散都是从网上知道的

懂球帝 浏览 212 12-29

电动车充完电不开,一天还能挣好几百?

小李车评李建红 浏览 508 08-17
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11