关闭广告

多模态大模型学会回头「看」：中科院自动化所提出GThinker模型

机器之心Pro2025-07-21 12:00:029619人阅读

尽管多模态大模型在数学、科学等结构化任务中取得了长足进步，但在需要灵活解读视觉信息的通用场景下，其性能提升瓶颈依然显著。现有模型普遍依赖基于知识的思维模式，却缺乏对视觉线索的深度校验与再思考能力，导致在复杂场景下频繁出错。

为解决这一难题，来自中科院自动化研究所紫东太初大模型研究中心的研究者提出 GThinker，一个旨在实现通用多模态推理的新型多模态大模型。

GThinker 的核心在于其创新的「线索引导式反思（Cue-Guided Rethinking）」模式，它赋予了模型在推理过程中主动校验、修正视觉理解的能力。

通过精心设计的两阶段训练流程，GThinker 在极具挑战性的 M³CoT 综合推理基准上取得了超越了最新的 O4-mini 模型，并在多个数学及知识推理榜单上展现出 SOTA 性能，证明了该方法的有效性和泛化能力。目前，论文、数据及模型均已开源。

版权与免责声明：本文内容转载自其他媒体，目的在于传递更多信息，不代表本网观点或立场，不承担此类作品侵权行为的自己责任及连带责任。

猜你喜欢

相关阅读

村庄挖出疑似乌木并被运走当地：已追回一批正在鉴定

红星新闻浏览 246 09-10

洪森指控泰国女总理＂叛国＂：我手里还有更多“猛料”

红星新闻浏览 7418 06-29

中国必须帮忙：印度已废，特朗普瞄准第二国

浏览 9283 07-14

精彩推荐

不足10人的团队，如何撬开华为生态？

虎嗅APP 浏览 4098 07-27

钢琴教父，卖掉海伦钢琴

斑马消费浏览 6422 07-31

蔚来新车不到一年尾灯两度开裂售后：化学品腐蚀拒保

上观新闻浏览 230 09-15

2025抖音创作者大会上，面向创作者发布四大计划

光子星球浏览 169 09-21

米高回应辱骂国足球迷杂种：我犯了错，希望球迷们能原谅我

懂球帝浏览 4046 07-17

大鹏白客新剧同台飙戏！一个曾血本无归，一个因社保出道，太真实

娱乐白名单浏览 9448 07-30

英媒抛出谬论：中国的空气质量改善加速了全球变暖

环球时报国际浏览 54 11-09

强化学习之父Richard Sutton揭示OaK架构：通向超级智能八步愿景

机器之心Pro 浏览 261 08-20

斯坦福MLE-Smith：自动生成机器学习竞赛题目

科技行者浏览 57 11-09

阿里巴巴：最新归纳4大业务架构，「1+6+N」汇报方式进入历史

深蓝财经浏览 279 08-23

18岁留学女孩被实时监控按＂指令＂回国装满一箱钱送走

极目新闻浏览 217 09-21

独家对话美团王莆中：我们不想卷，但不能不反击

晚点LatePost 浏览 733 07-17

斯瓦泰克23冠分布：大满贯6冠、1000赛10冠、年终总决赛1冠

直播吧浏览 9670 07-13

再胜委内瑞拉通道采访！廖三宁强调防守，赵睿回应热身价值与磨合

篮球资讯达人浏览 1572 07-26

增程动力可选8座吉利银河V900申报信息公布

网易汽车浏览 165 09-12

激怒中国的不仅是10%关税，而是另外的举动

浏览 6844 07-14

人工智能时代如何深化跨区域知识产权保护协作，嘉定这场论坛进行了探讨

上观新闻浏览 92 10-21

升至3477亿美元伯克希尔一季度现金储备再创新高

澎湃新闻浏览 1510 05-04

你没读懂比亚迪巴西工厂首车下线的意义

汽车公社浏览 1002 07-12

苗春生：泥塑的脉动 | 陕西守艺人

粉巷财经浏览 3915 07-18

媒体:特朗普2.0亚洲＂首秀＂重中之重还是与中国有关

上观新闻浏览 85 10-27

本站所有信息收集于互联网，如本站收集信息侵权，请联系我们及时删除
沪ICP备20017958号-11