关闭广告

多模态大模型学会回头「看」:中科院自动化所提出GThinker模型

机器之心Pro2025-07-21 12:00:029260人阅读



尽管多模态大模型在数学、科学等结构化任务中取得了长足进步,但在需要灵活解读视觉信息的通用场景下,其性能提升瓶颈依然显著。现有模型普遍依赖基于知识的思维模式,却缺乏对视觉线索的深度校验与再思考能力,导致在复杂场景下频繁出错。

为解决这一难题,来自中科院自动化研究所紫东太初大模型研究中心的研究者提出 GThinker,一个旨在实现通用多模态推理的新型多模态大模型。

GThinker 的核心在于其创新的「线索引导式反思(Cue-Guided Rethinking)」模式,它赋予了模型在推理过程中主动校验、修正视觉理解的能力。

通过精心设计的两阶段训练流程,GThinker 在极具挑战性的 M³CoT 综合推理基准上取得了超越了最新的 O4-mini 模型,并在多个数学及知识推理榜单上展现出 SOTA 性能,证明了该方法的有效性和泛化能力。目前,论文、数据及模型均已开源。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

防守真行!杨瀚森首节贡献3分2板1助2帽 对位的13号秀和米西9中1

直播吧 浏览 2453 07-16

21.99万元起买华为满血智驾/鸿蒙座舱 岚图FREE+来了

网易汽车 浏览 9806 07-13

他饰演李幼斌的女儿,坐月子遭家暴27岁离世

冷紫葉 浏览 5150 07-13

此一时彼一时,美元理财黯然失色!

21金融圈 浏览 4291 07-18

王灿晒杜淳与女儿互动日常,父女情深好温馨,走到哪亲到哪儿

扒虾侃娱 浏览 2493 07-22

首发“俊雅蓝”限定车色 宝骏云海俊雅版8月上市

网易汽车 浏览 4883 07-29

“太空快递”签收后航天员在忙什么?中国空间站多领域新实验上线

IT之家 浏览 9479 07-27

暴涨超155%!养猪巨头新希望,净赚超6.8亿

侃见财经 浏览 2796 07-16

张本智和:我之前输给王楚钦很多次,拉斯维加斯可以带给我幸运

懂球帝 浏览 1616 07-13

8月2日徐州队VS扬州队门票即将开票 票价依然是5元/张!

直播吧 浏览 2527 07-29

1晚房价3千 重庆一酒店称提供小熊猫叫早服务引争议

大风新闻 浏览 8672 06-19

特朗普威胁:将每天给大约10个国家发送信件 接关税吧

澎湃新闻 浏览 5114 07-05

43岁阎鹤祥透露已婚:妻子怀孕4个月

极目新闻 浏览 6247 07-23

博主:国安全主力出征足协杯张健智在列,柏杨、何宇鹏因伤缺席

直播吧 浏览 1175 07-21

达华智能因信披违规被立案 股民可登记索赔

深蓝财经 浏览 8591 07-29

刚刚,扎克伯格公开信:Meta不会开源全部模型

机器之心Pro 浏览 8561 07-31

卫星图显示:13架俄大型机遭摧毁 包括8架图95

观察者网 浏览 5675 06-04

“知产”变“资产”,看这家银行如何助企破局

Daily每日财报 浏览 7452 07-27

高管匿名投票除弗拉格外最佳新秀:VJ第1 哈珀第2 杨瀚森获得1票

直播吧 浏览 9329 07-25

特朗普说他与普京都认为以伊冲突应该结束

新华社 浏览 1849 06-15

两高中生骑电动车撞墙身亡 家属:最高时速100多公里

FM93浙江交通之声 浏览 3427 07-24
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11