关闭广告

多模态大模型学会回头「看」:中科院自动化所提出GThinker模型

机器之心Pro2025-07-21 12:00:029559人阅读



尽管多模态大模型在数学、科学等结构化任务中取得了长足进步,但在需要灵活解读视觉信息的通用场景下,其性能提升瓶颈依然显著。现有模型普遍依赖基于知识的思维模式,却缺乏对视觉线索的深度校验与再思考能力,导致在复杂场景下频繁出错。

为解决这一难题,来自中科院自动化研究所紫东太初大模型研究中心的研究者提出 GThinker,一个旨在实现通用多模态推理的新型多模态大模型。

GThinker 的核心在于其创新的「线索引导式反思(Cue-Guided Rethinking)」模式,它赋予了模型在推理过程中主动校验、修正视觉理解的能力。

通过精心设计的两阶段训练流程,GThinker 在极具挑战性的 M³CoT 综合推理基准上取得了超越了最新的 O4-mini 模型,并在多个数学及知识推理榜单上展现出 SOTA 性能,证明了该方法的有效性和泛化能力。目前,论文、数据及模型均已开源。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

好看的裙子不嫌多!这几条洋气显瘦巨百搭,谁穿谁好看!

Yuki女人故事 浏览 213 08-24

国产EDA重磅并购案终止!华大九天交易折戟,芯和要独立上市?

时代周报 浏览 6673 07-12

助力智能边缘,Ceva携边缘AI IP解决方案亮相集微半导体大会

爱集微 浏览 5287 07-13

2025年高考作文题出炉

人民日报 浏览 1046 06-07

“喝不上”到“放心喝”,中国如何用20年打造一杯全球顶尖牛奶?

智谷趋势 浏览 3065 07-17

中国女游客潜水被酒店船只遗忘 经历"绝望"35分钟

封面新闻 浏览 135 09-16

江苏首富,又悄悄干大了?

市值Observation 浏览 133 09-10

教练机梯队:压轴出场 接受检阅

新华社 浏览 157 09-04

西班牙登顶!FIFA排名:阿根廷跌至第3 葡萄牙超巴西 国足仍第94

直播吧 浏览 137 09-11

6月各线城市商品住宅价格环比下降

界面新闻 浏览 8928 07-15

今年娱乐圈最尬的一幕,赵露思给的

娱乐圈笔娱君 浏览 10012 08-06

别再买“网红同款”了,显胖又低级!

Yuki女人故事 浏览 114 09-15

急诊科专家解答动物抓咬伤八大问题

网易健康 浏览 354 08-14

秘鲁“阵风”大单落空,巴黎破了大防

浏览 1646 07-14

英男子记忆减退怀疑妻子出轨 原来脑部长肿瘤现已离世

潇湘晨报 浏览 4200 07-28

将过招中国男篮!媒体人:波黑来华12人中11人入选欧锦赛24人名单

直播吧 浏览 8198 07-24

记者:曼联仍想签更多边锋,他们有意罗德里戈且已关注他很久

直播吧 浏览 2124 07-13

《731》风波升级!原编剧放弃署名,导演赵林山自曝拿龙标疑造假

萌神木木 浏览 4513 08-03

240亿身家“造纸女王”,要“翻身”了

侃见财经 浏览 7734 07-27

车长突破5.1米 全新问界M7全面靠拢M8/M9

网易汽车 浏览 2516 07-29

纯电不香了?智己携“恒星”强势入局增程市场

网易汽车 浏览 6889 08-06
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11