关闭广告

多模态大模型学会回头「看」:中科院自动化所提出GThinker模型

机器之心Pro2025-07-21 12:00:029832人阅读



尽管多模态大模型在数学、科学等结构化任务中取得了长足进步,但在需要灵活解读视觉信息的通用场景下,其性能提升瓶颈依然显著。现有模型普遍依赖基于知识的思维模式,却缺乏对视觉线索的深度校验与再思考能力,导致在复杂场景下频繁出错。

为解决这一难题,来自中科院自动化研究所紫东太初大模型研究中心的研究者提出 GThinker,一个旨在实现通用多模态推理的新型多模态大模型。

GThinker 的核心在于其创新的「线索引导式反思(Cue-Guided Rethinking)」模式,它赋予了模型在推理过程中主动校验、修正视觉理解的能力。

通过精心设计的两阶段训练流程,GThinker 在极具挑战性的 M³CoT 综合推理基准上取得了超越了最新的 O4-mini 模型,并在多个数学及知识推理榜单上展现出 SOTA 性能,证明了该方法的有效性和泛化能力。目前,论文、数据及模型均已开源。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

靠“早C晚A”火出圈!HBN赴港递表,44%抖音平台复购率印证国民好感|港E声

时代周报 浏览 227 01-28

外媒:巴基斯坦确认向沙特提供核保护伞

扬子晚报 浏览 412 09-21

2025内河港口1-8月吞吐量:苏州4亿吨,九江第4,岳阳超重庆武汉

小鹏财经 浏览 308 10-13

WAIC前线|讯飞星火 X1升级发布 中英同传首字响应仅2秒

网易科技报道 浏览 8149 07-27

醒醒吧! “女干部”别硬演,满屏都是“嘟嘟唇”,内娱没人了吗

娱乐圈笔娱君 浏览 6110 07-08

抛光镀铬超级亮!PNY 40周年纪念版RTX 5090/5080规格确认

快科技 浏览 396 08-25

汤唯最刻骨铭心的那段情,我每年都想重温

Yuki女人故事 浏览 305 10-07

范乔丹:小卡刚来猛龙就说会走 感谢他让我赚大钱

体坛周报 浏览 230 12-16

放弃实体SIM卡的iPhone能买吗:三大运营商均推进,联通用户或成首批尝鲜者

红星资本局 浏览 413 09-11

特种机梯队:海军空军新型特种支援力量首次集体亮相

新华社 浏览 363 09-04

"多管局局长"拍市政问题火了 网友:只有深圳包容他

中国新闻周刊 浏览 226 12-21

闪电快讯|魏牌高山7预售启动,售价28.98万元

电厂 浏览 396 09-11

夺走宗家一半家产,娃哈哈的“隐形老板娘”,她到底凭什么?

北向财经 浏览 6717 07-21

瞄准2028年重要选举 郑丽文最新表态

新京报政事儿 浏览 273 11-05

墨西哥拟提高对华商品关税,涵盖汽车、纺织品和塑料等产品

国际金融报 浏览 412 09-01

媒体:野田佳彦看到机会要对高市下手 高市有可能下台

新民周刊 浏览 224 01-18

E句话|贾静雯看权志龙演唱会被粉丝围攻了?

仙女事件簿 浏览 9868 07-13

夏天的白裙,可以像赫本那样穿

Yuki女人故事 浏览 48 05-06

外媒:特斯拉顶配Cybertruck价格进一步上涨

环球网资讯 浏览 411 09-01

中国罕见亮战略底牌 大国重器同时亮相让美认清一现实

空天力量 浏览 3632 08-04

佩杜拉:那不勒斯确实对米雷蒂感兴趣,但交易或涉及韦尔加拉

懂球帝 浏览 5029 07-25
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11