关闭广告

马里兰大学团队让3.5B参数小模型媲美50B大模型的推理能力

科技行者2025-08-27 00:00:01406人阅读


这项由马里兰大学计算机科学系的Jonas Geiping和Tom Goldstein教授领导的研究团队发表于2025年2月的突破性研究,首次展示了一种全新的人工智能思维方式。该研究论文《用潜在推理扩展测试时计算:一种循环深度方法》可通过arXiv:2502.05171v2获取完整内容。研究团队还包括来自图宾根大学、劳伦斯利弗莫尔国家实验室等多个机构的研究人员,他们开发的模型代码已在GitHub开源,训练好的模型也在HuggingFace平台公开可用。

设想一下这样的场景:当你遇到复杂问题时,不是立刻脱口而出答案,而是在心中反复思考、推演,直到想透彻了才开口。研究团队发现,现有的AI模型就像那些总是急于回答的学生,缺乏深度思考的能力。它们通常要么依靠庞大的参数量来"强记硬背",要么需要把思维过程完全用文字表达出来,就像必须把所有想法都写在草稿纸上一样繁琐。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

特朗普称:半导体关税要来了 可能达到300%

参考消息 浏览 435 08-17

2025年上半年业绩稳健增长 多业务板块协同发力智能汽车赛道

证券市场周刊 浏览 472 08-22

伊朗公开展示导弹 武装部队警告美国

极目新闻 浏览 92 04-22

首批31家券商业绩全部预增!国泰海通、中国银河激烈角逐,中金公司止跌回升

时代周报 浏览 5260 07-17

双良节能:从“节能老将”到“液冷新势力”

英才商业 浏览 380 09-11

女店员疑遭顾客"动手动脚"蜷缩大喊"不要" 警方回应

大风新闻 浏览 459 08-16

苹果新手机开售即破发 砍单到几乎停产

21世纪经济报道 浏览 279 10-27

公募基金业绩比较基准迎规范,证监会、中基协公开征求意见

华夏时报 浏览 281 11-01

李嘉欣黎姿携老公聚餐,两大豪门夫妻甘愿镶边

不八卦会死星人 浏览 330 09-06

创历史新高 7月国际航线旅客运输量达709万人次

界面新闻 浏览 482 08-16

陶虹与朋友相聚,17岁女儿五官与神态似徐峥

黔乡小姊妹 浏览 214 12-21

佟丽娅带董璇母女玩新疆,两姐妹脸贴脸才发现,长得已经不像了!

观察鉴娱 浏览 4334 07-23

年薪上亿"炫富"清华学霸曾想反诉公司诽谤 被控三项罪

红星新闻 浏览 436 09-18

鏖战三盘,遗憾败北,贾尼斯与挑战赛冠军擦肩而过

网球之家 浏览 555 08-11

只此一场!来自毕赣导演的特别礼物

幕味儿 浏览 9768 07-11

8年过后再看冯小刚亲选的“芳华三美”

大铁猫娱乐 浏览 273 10-29

NBA战报:雷霆94-91险胜掘金,沃特森15分

懂球帝 浏览 311 10-18

续航超600km 起亚EV4 Hatchback或引入国内

车质网 浏览 9744 07-04

小米王腾违规泄密,雷军挥泪「斩」爱将!

节点财经 浏览 381 09-09

WAIC 2025|摩尔线程全功能GPU为美好世界加速

爱集微 浏览 10137 07-22

AI智能体“入职”,重新定义智能办公丨WAIC 2025观察

国际金融报 浏览 2377 07-29
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11