关闭广告

多模态大模型学会回头「看」:中科院自动化所提出GThinker模型

机器之心Pro2025-07-21 12:00:029228人阅读



尽管多模态大模型在数学、科学等结构化任务中取得了长足进步,但在需要灵活解读视觉信息的通用场景下,其性能提升瓶颈依然显著。现有模型普遍依赖基于知识的思维模式,却缺乏对视觉线索的深度校验与再思考能力,导致在复杂场景下频繁出错。

为解决这一难题,来自中科院自动化研究所紫东太初大模型研究中心的研究者提出 GThinker,一个旨在实现通用多模态推理的新型多模态大模型。

GThinker 的核心在于其创新的「线索引导式反思(Cue-Guided Rethinking)」模式,它赋予了模型在推理过程中主动校验、修正视觉理解的能力。

通过精心设计的两阶段训练流程,GThinker 在极具挑战性的 M³CoT 综合推理基准上取得了超越了最新的 O4-mini 模型,并在多个数学及知识推理榜单上展现出 SOTA 性能,证明了该方法的有效性和泛化能力。目前,论文、数据及模型均已开源。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

男童与生父继母出行被安排缩在后备箱 生父:不会道歉

极目新闻 浏览 2726 07-17

认不出!李绮红55岁素颜照曝光,在加拿大当护士,家庭超幸福

娱乐白名单 浏览 6871 07-28

比亚迪仰望 U8L 内饰亮相:轴距 3250mm 三排布局,下半年上市

IT之家 浏览 9007 07-14

30+中女的爱用好物分享!夏天太需要它了

黎贝卡的异想世界 浏览 4416 06-17

媒体:泰柬边境重燃战火 在泰国产生了巨大的政治影响

红星新闻 浏览 2472 07-25

记者:维拉对图卢兹后卫坎沃潜力深信不疑,准备出手将其招至麾下

直播吧 浏览 565 07-15

DeepSeek流量下滑,这半年梁文锋都干了啥

中国企业家杂志 浏览 2609 07-15

小区地下车库排风管坠落 女子车玻璃被砸穿人吓到发抖

看看新闻Knews 浏览 2607 07-10

印度、孟加拉关切雅鲁藏布江下游水电站工程 中方回应

外交部网站 浏览 8291 07-24

恒坤新材新三板转战科创板 今日上会10亿募资自研毛利率待提升|IPO研究院

Daily每日财报 浏览 4431 07-25

读懂IPO|为守住市占率降价,乐动机器人陷三年亏损,割草机能否破盈利僵局?

时代周报 浏览 3021 07-17

媒体:特朗普宣布多份协议"带节奏" 欧盟反而转向强硬

新民晚报 浏览 4710 07-25

vivo Y50 5G 手机现身中国电信终端产品库,1299 元起

IT之家 浏览 516 07-13

“杭州六小龙”两位创始人成香港特首智囊!

每日经济新闻 浏览 3717 07-14

乘客拍下飞机上有人多次吸电子烟 厦航回应

极目新闻 浏览 6211 06-19

官方:亚特兰大25岁后卫巴克在训练中遭遇十字韧带断裂,周一手术

直播吧 浏览 9335 07-26

F4合体四个人面相都变了,周渝民疲惫朱孝天发福,言承旭状态最好

趣看热点 浏览 1818 07-15

记者实探粮交会:全谷物受捧,“黑科技”争艳

中国商报 浏览 1458 07-14

宗馥莉被3名自称同父异母弟妹起诉,娃哈哈遗产争夺该咋看?

江瀚视野 浏览 2306 07-17

中美元首被指将在未来几月内会面 外交部回应

澎湃新闻 浏览 2356 07-22

最后1秒,国足反击直接传出界!董路狂批:这些球员只是假装在拼

风过乡 浏览 1910 07-13
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11