关闭广告

多模态大模型学会回头「看」:中科院自动化所提出GThinker模型

机器之心Pro2025-07-21 12:00:029619人阅读



尽管多模态大模型在数学、科学等结构化任务中取得了长足进步,但在需要灵活解读视觉信息的通用场景下,其性能提升瓶颈依然显著。现有模型普遍依赖基于知识的思维模式,却缺乏对视觉线索的深度校验与再思考能力,导致在复杂场景下频繁出错。

为解决这一难题,来自中科院自动化研究所紫东太初大模型研究中心的研究者提出 GThinker,一个旨在实现通用多模态推理的新型多模态大模型。

GThinker 的核心在于其创新的「线索引导式反思(Cue-Guided Rethinking)」模式,它赋予了模型在推理过程中主动校验、修正视觉理解的能力。

通过精心设计的两阶段训练流程,GThinker 在极具挑战性的 M³CoT 综合推理基准上取得了超越了最新的 O4-mini 模型,并在多个数学及知识推理榜单上展现出 SOTA 性能,证明了该方法的有效性和泛化能力。目前,论文、数据及模型均已开源。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

不足10人的团队,如何撬开华为生态?

虎嗅APP 浏览 4098 07-27

钢琴教父,卖掉海伦钢琴

斑马消费 浏览 6422 07-31

蔚来新车不到一年尾灯两度开裂 售后:化学品腐蚀拒保

上观新闻 浏览 230 09-15

2025抖音创作者大会上,面向创作者发布四大计划

光子星球 浏览 169 09-21

米高回应辱骂国足球迷杂种:我犯了错,希望球迷们能原谅我

懂球帝 浏览 4046 07-17

大鹏白客新剧同台飙戏!一个曾血本无归,一个因社保出道,太真实

娱乐白名单 浏览 9448 07-30

英媒抛出谬论:中国的空气质量改善 加速了全球变暖

环球时报国际 浏览 54 11-09

强化学习之父Richard Sutton揭示OaK架构:通向超级智能八步愿景

机器之心Pro 浏览 261 08-20

斯坦福MLE-Smith:自动生成机器学习竞赛题目

科技行者 浏览 57 11-09

阿里巴巴:最新归纳4大业务架构,「1+6+N」汇报方式进入历史

深蓝财经 浏览 279 08-23

18岁留学女孩被实时监控 按"指令"回国装满一箱钱送走

极目新闻 浏览 217 09-21

独家对话美团王莆中:我们不想卷,但不能不反击

晚点LatePost 浏览 733 07-17

斯瓦泰克23冠分布:大满贯6冠、1000赛10冠、年终总决赛1冠

直播吧 浏览 9670 07-13

再胜委内瑞拉通道采访!廖三宁强调防守,赵睿回应热身价值与磨合

篮球资讯达人 浏览 1572 07-26

增程动力 可选8座 吉利银河V900申报信息公布

网易汽车 浏览 165 09-12

激怒中国的不仅是10%关税,而是另外的举动

浏览 6844 07-14

人工智能时代如何深化跨区域知识产权保护协作,嘉定这场论坛进行了探讨

上观新闻 浏览 92 10-21

升至3477亿美元 伯克希尔一季度现金储备再创新高

澎湃新闻 浏览 1510 05-04

你没读懂比亚迪巴西工厂首车下线的意义

汽车公社 浏览 1002 07-12

苗春生:泥塑的脉动 | 陕西守艺人

粉巷财经 浏览 3915 07-18

媒体:特朗普2.0亚洲"首秀" 重中之重还是与中国有关

上观新闻 浏览 85 10-27
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11