关闭广告

马里兰大学团队让3.5B参数小模型媲美50B大模型的推理能力

科技行者2025-08-27 00:00:01218人阅读


这项由马里兰大学计算机科学系的Jonas Geiping和Tom Goldstein教授领导的研究团队发表于2025年2月的突破性研究,首次展示了一种全新的人工智能思维方式。该研究论文《用潜在推理扩展测试时计算:一种循环深度方法》可通过arXiv:2502.05171v2获取完整内容。研究团队还包括来自图宾根大学、劳伦斯利弗莫尔国家实验室等多个机构的研究人员,他们开发的模型代码已在GitHub开源,训练好的模型也在HuggingFace平台公开可用。

设想一下这样的场景:当你遇到复杂问题时,不是立刻脱口而出答案,而是在心中反复思考、推演,直到想透彻了才开口。研究团队发现,现有的AI模型就像那些总是急于回答的学生,缺乏深度思考的能力。它们通常要么依靠庞大的参数量来"强记硬背",要么需要把思维过程完全用文字表达出来,就像必须把所有想法都写在草稿纸上一样繁琐。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

工信部或推新规:新车登记后6个月内禁止转让

证券时报 浏览 9650 07-21

跟董明珠掐架十年,这家公司要逆袭了?

豹变 浏览 257 08-20

雷军“悔棋”背后,存储市场的涨价潮也是窗口期

北京商报 浏览 79 10-31

31.99万起,猛士M817正式上市!

电动知家 浏览 263 08-19

无人机电池也疯狂!宁德、赣锋已开启“跨界混战”

华夏时报 浏览 6944 07-13

乌武装部队前总司令扎卢日内提议:在乌克兰部署核武器

环球时报国际 浏览 102 12-02

大学生在北京"倒贴1万"实习:除了免费午饭啥都要花钱

南风窗 浏览 359 08-23

芦哲:降准降息利好哪些权益资产?

首席经济学家论坛 浏览 92 10-23

定位大型SUV 腾势N8L无伪装实车图曝光

车质网 浏览 1715 07-14

僵局继续!库明加团队提出3年8200万美元续约 惨遭勇士拒绝

醉卧浮生 浏览 1938 08-12

“飞行的五角大楼”抵达华盛顿附近:沿不寻常的航线

红星新闻 浏览 5386 06-20

畅想未来!联手詹姆斯东契奇 艾顿在湖人的最佳表现会是怎样的?

直播吧 浏览 233 08-26

香港迪士尼偶遇奚梦瑶,儿子女儿被保镖贴身保护

情感大头说说 浏览 106 10-13

沃尔沃CEO萨缪尔森预测:中国电动汽车攻势将淘汰部分西方车企

IT之家 浏览 205 09-11

"路怒"特斯拉高速路上多次别车还竖中指挑衅 交警:拘

封面新闻 浏览 2257 07-24

泰晤士报:水晶宫签替代者出现问题,尚不明确是否会影响格伊

懂球帝 浏览 238 09-02

孩子听力错过这个黄金期难补救!

网易健康 浏览 9948 03-17

阿圭罗:亚马尔配得上巴萨10号,但拿他与梅西比较对他没好处

懂球帝 浏览 4987 07-25

演完《漂白》演《生万物》,她演技太好判若两人

娱君坠星河 浏览 273 08-22

家庭皮肤消毒该避开的坑,这样操作才安全!

网易健康 浏览 275 08-22

国际空间站2030年退役,多个商业项目或接棒,NASA将迎来“后空间站时代”

环球网资讯 浏览 184 09-10
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11