关闭广告

多模态大模型学会回头「看」:中科院自动化所提出GThinker模型

机器之心Pro2025-07-21 12:00:029831人阅读



尽管多模态大模型在数学、科学等结构化任务中取得了长足进步,但在需要灵活解读视觉信息的通用场景下,其性能提升瓶颈依然显著。现有模型普遍依赖基于知识的思维模式,却缺乏对视觉线索的深度校验与再思考能力,导致在复杂场景下频繁出错。

为解决这一难题,来自中科院自动化研究所紫东太初大模型研究中心的研究者提出 GThinker,一个旨在实现通用多模态推理的新型多模态大模型。

GThinker 的核心在于其创新的「线索引导式反思(Cue-Guided Rethinking)」模式,它赋予了模型在推理过程中主动校验、修正视觉理解的能力。

通过精心设计的两阶段训练流程,GThinker 在极具挑战性的 M³CoT 综合推理基准上取得了超越了最新的 O4-mini 模型,并在多个数学及知识推理榜单上展现出 SOTA 性能,证明了该方法的有效性和泛化能力。目前,论文、数据及模型均已开源。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

夫妻闪婚闪离后互相伤害 女方找人男扮女装"报复"前夫

上观新闻 浏览 765 09-11

外卖大战周末继续,用户感慨“喝不完”,闪击战变持久战

第一财经资讯 浏览 4103 07-13

王化:“雷军谈造车最难的是做轮毂”是断章取义

三言科技 浏览 1606 07-12

全尺寸纯电稀罕物 问界M8纯电版售35.98-44.98万

网易汽车 浏览 389 08-26

躺枪!帕尔梅拉斯主帅:如果砸钱能赢,巴黎圣日耳曼应该年年夺冠

直播吧 浏览 2379 07-17

1391场,44岁巴西门将法比奥成为足坛正式比赛出场最多的球员

懂球帝 浏览 454 08-20

量子版“梵高名画”,量子流体中首次观测到新型涡旋结构

IT之家 浏览 485 08-12

飞抵双流机场后“打甩手”去看世运会比赛

爱看头条 浏览 9663 08-11

北约建"无人机墙"彻底激怒俄罗斯 俄方强硬回应

上观新闻 浏览 450 09-29

全球股市最强风口,彻底拦不住了?

财经锐眼 浏览 188 02-04

吃相难看!史晓燕曝何晴离婚有隐情,力挺许亚军

収起了底线 浏览 193 12-23

MSC咨询合伙人金霞:可持续发展+AI,重构商业增长范式

南方都市报 浏览 273 11-01

中国大米超越日本“米王”,释放哪些信号?

环球网资讯 浏览 469 08-11

球迷态度:CBA第一阶段结束,你对你的主队表现满意吗?

懂球帝 浏览 214 02-04

媒体:特朗普一顿折腾 中国将重新成为德最大贸易伙伴

澎湃新闻 浏览 6069 08-10

豪华品牌的插混车为什么卖不动

吴佩频道 浏览 483 05-28

塞门约:目前对种族歧视采取的措施远远不够,可以考虑判刑

懂球帝 浏览 479 08-23

事实证明,女人到了五六十岁别再去扮嫩!这样穿又优雅又显贵

静儿时尚达人 浏览 315 10-14

AI首个「铁饭碗」:在浦东美术馆,我用豆包跟毕加索聊了一上午

雷科技 浏览 227 01-21

2000万粉丝的麦小登,如今被骂“卖货登”,她经历了什么?

娱乐白名单 浏览 697 08-06

邓心怡高频“救火”背后 诺安基金人才流失困境待解

网易财经 浏览 1580 07-26
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11