关闭广告

多模态大模型学会回头「看」:中科院自动化所提出GThinker模型

机器之心Pro2025-07-21 12:00:029625人阅读



尽管多模态大模型在数学、科学等结构化任务中取得了长足进步,但在需要灵活解读视觉信息的通用场景下,其性能提升瓶颈依然显著。现有模型普遍依赖基于知识的思维模式,却缺乏对视觉线索的深度校验与再思考能力,导致在复杂场景下频繁出错。

为解决这一难题,来自中科院自动化研究所紫东太初大模型研究中心的研究者提出 GThinker,一个旨在实现通用多模态推理的新型多模态大模型。

GThinker 的核心在于其创新的「线索引导式反思(Cue-Guided Rethinking)」模式,它赋予了模型在推理过程中主动校验、修正视觉理解的能力。

通过精心设计的两阶段训练流程,GThinker 在极具挑战性的 M³CoT 综合推理基准上取得了超越了最新的 O4-mini 模型,并在多个数学及知识推理榜单上展现出 SOTA 性能,证明了该方法的有效性和泛化能力。目前,论文、数据及模型均已开源。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

里奇-保罗:当詹姆斯退役后,媒体就会找到新的大反派去攻击

懂球帝 浏览 2561 07-16

银行股强势领涨 年内33次刷新历史高点

证券时报 浏览 8697 07-12

上海AI判定停车费被指掐秒算钱:让人下车停12秒收4元

潇湘晨报 浏览 282 08-28

安东尼:我们会就我的红牌上诉,裁判也知道我的动作没有恶意

懂球帝 浏览 37 11-25

北约:将考虑对俄罗斯发动“先发制人”的打击

环球网资讯 浏览 108 12-02

37岁少妇将已婚男子约家中"吃饭" 成功拿下他发生关系

胖胖侃咖 浏览 5413 07-12

终结9连败!布云朝克特2-0马加丹,晋级ATP250洛斯卡沃斯站次轮

直播吧 浏览 3021 07-16

黄金价格回调ETF热度不减 不同跟踪标的下黄金ETF涨跌区别在哪儿?

金证研 浏览 95 10-31

车厂都在强攻,但新能源份额涨不动了

汽车公社 浏览 251 05-16

比小米SU7便宜1万 全新智己L6上市你选谁

网易汽车 浏览 278 05-15

监管重锤4200万!上海银行内控“黑洞”为何补不上

闺蜜财经 浏览 5045 08-11

中国游泳小将创历史!美媒:12岁年龄作弊,不可能游到2分09秒21

侃球熊弟 浏览 7364 07-29

19块9一只的烤鸭里,藏着西方学不会的中国魔法

新消费101 浏览 8717 08-07

北芯生命:核心产品与新技术竞争关系陷罗生门 自称“金标准”背后技术路径现疑云

金证研 浏览 250 08-29

SpaceX称识别并切断缅甸电诈园区周边逾2500台“星链”设备

澎湃新闻 浏览 114 10-23

石破天惊,日本电影新浪潮的开山大师名作!

幕味儿 浏览 82 10-25

印媒:莫迪将于8月31日至9月1日访华

环球网资讯 浏览 3574 08-07

立场问题零容忍!双面人吴宗宪再现争议言论

界史 浏览 5346 07-30

每学年不少于8课时 北京将全面开展人工智能通识教育

经济观察报 浏览 223 09-10

马斯克开杠"大而美"法案 美众议长:特朗普对他不满

环球网资讯 浏览 8842 06-06

劝君不做孙正义

饭统戴老板 浏览 1584 07-25
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11