关闭广告

马里兰大学团队让3.5B参数小模型媲美50B大模型的推理能力

科技行者2025-08-27 00:00:01405人阅读


这项由马里兰大学计算机科学系的Jonas Geiping和Tom Goldstein教授领导的研究团队发表于2025年2月的突破性研究,首次展示了一种全新的人工智能思维方式。该研究论文《用潜在推理扩展测试时计算:一种循环深度方法》可通过arXiv:2502.05171v2获取完整内容。研究团队还包括来自图宾根大学、劳伦斯利弗莫尔国家实验室等多个机构的研究人员,他们开发的模型代码已在GitHub开源,训练好的模型也在HuggingFace平台公开可用。

设想一下这样的场景:当你遇到复杂问题时,不是立刻脱口而出答案,而是在心中反复思考、推演,直到想透彻了才开口。研究团队发现,现有的AI模型就像那些总是急于回答的学生,缺乏深度思考的能力。它们通常要么依靠庞大的参数量来"强记硬背",要么需要把思维过程完全用文字表达出来,就像必须把所有想法都写在草稿纸上一样繁琐。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

商务部回应审查Meta收购Manus:须符合中国法律法规

财联社 浏览 242 01-09

女子买"载重3吨"电三轮改摩旅房车 发现载重仅200公斤

大风新闻 浏览 531 08-26

几千元一台的AI学习机,谁在掘金谁在买?

中新经纬 浏览 465 09-09

江苏银行“封王”:对公狂飙,资本金“告急”

节点财经 浏览 408 09-11

以全面智联推动产业升级,首届智联电动车产业全球发展峰会在渝举行

上游新闻 浏览 358 09-20

水晶专场|| 我最近超爱戴这条!被大家追着问的链接终于来了~

黎贝卡的异想世界 浏览 10596 07-22

“无人机+”,加出丰富应用场景

金台资讯 浏览 6002 06-05

外媒:俄罗斯发动冲突爆发以来"最大规模"空袭

鲁中晨报 浏览 481 09-08

特斯拉终于用上了国产大模型!豆包和DeepSeek上车

车东西 浏览 453 08-23

Here we go!罗马诺:米兰先租后买总价2900万欧签下博尼费斯

懂球帝 浏览 433 08-22

董璇婚后带娃新疆游玩,老公张维伊未陪同,小酒窝社交能力好强

扒虾侃娱 浏览 4029 07-18

中央巡视形成震慑效应 一周来多名在任官员主动投案

南方都市报 浏览 1041 07-18

比埃拉:我不是完全免费踢球,因为联赛不允许,我只会领最低工资

直播吧 浏览 8308 07-14

10月龄婴儿展厅内喝奶被赶 上海动物园道歉

环球网 浏览 5595 07-02

英伟达涨逾4% 股价创历史新高

证券时报 浏览 1613 07-16

新款兰博基尼Urus Performante测试谍照曝光

车质网 浏览 7015 07-01

10位院士与会 2025中国自动化大会成功举行

网易科技报道 浏览 281 10-13

虞书欣受风波影响!缺席新剧应援活动

萌神木木 浏览 384 09-07

标配15.6寸大屏+大空间 极狐T1预售6.88-9.38万

网易汽车 浏览 434 08-23

月之暗面发布并开源Kimi K2模型

环球网资讯 浏览 9551 07-12

以色列国防部长宣布国内进入特殊状态

财联社 浏览 4756 06-13
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11