关闭广告

马里兰大学团队让3.5B参数小模型媲美50B大模型的推理能力

科技行者2025-08-27 00:00:01168人阅读


这项由马里兰大学计算机科学系的Jonas Geiping和Tom Goldstein教授领导的研究团队发表于2025年2月的突破性研究,首次展示了一种全新的人工智能思维方式。该研究论文《用潜在推理扩展测试时计算:一种循环深度方法》可通过arXiv:2502.05171v2获取完整内容。研究团队还包括来自图宾根大学、劳伦斯利弗莫尔国家实验室等多个机构的研究人员,他们开发的模型代码已在GitHub开源,训练好的模型也在HuggingFace平台公开可用。

设想一下这样的场景:当你遇到复杂问题时,不是立刻脱口而出答案,而是在心中反复思考、推演,直到想透彻了才开口。研究团队发现,现有的AI模型就像那些总是急于回答的学生,缺乏深度思考的能力。它们通常要么依靠庞大的参数量来"强记硬背",要么需要把思维过程完全用文字表达出来,就像必须把所有想法都写在草稿纸上一样繁琐。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

外套里面穿什么?这8件“姐感内搭”高级又好看

LinkFashion 浏览 2 10-30

美网乱了,7人首进16强!郑钦文排名继续下跌,曝最快半个月复出

侃球熊弟 浏览 193 09-01

遗产战进入高潮 关键时刻"影子夫人"杜建英资金出状况

金融界 浏览 2272 07-18

石药集团上半年营收132亿,抗肿瘤药跌超六成!达成四项对外授权金额达700亿

时代周报 浏览 180 08-24

杨少华追悼会现场:长子神情凝重太憔悴,杨议跷二郎腿商议后事

萌神木木 浏览 875 07-11

Opta预测新赛季法甲排名:巴黎无悬念第1,里尔第2、摩纳哥第3

懂球帝 浏览 8509 08-14

湖北襄阳网警:一男子发布诋毁九三阅兵言论被拘留

界面新闻 浏览 148 09-06

米体:不莱梅想签下姆班古拉,尤文有意多多、克洛斯和威德默

懂球帝 浏览 9802 07-13

宁德时代重要矿山停产 有投资者光着膀子深夜上山蹲守

每日经济新闻 浏览 228 08-12

远藤航:以利物浦球员身份重返日本,是我梦想成真的时刻

懂球帝 浏览 5667 07-31

雷军何故挥泪“斩马谡”?

财视传播 浏览 129 09-09

13.59万元起售,2026款深蓝L07上市

北京商报 浏览 6044 08-14

女子丢下爱猫失联多日 警方在屋内洗衣机下发现一滴血

看看新闻Knews 浏览 8758 08-09

上年纪的女人买“裤子”,不妨按照这3个原则试试,显瘦时髦

静儿时尚达人 浏览 54 10-04

足球报:国安并非没考虑过土帅,针对今年问题已做长远规划

懂球帝 浏览 57 10-13

比国足还低1位!世界第95科索沃2-0第29瑞典,相当于国足击败谁?

直播吧 浏览 137 09-09

NBA新赛季大前锋TOP10:字母一枝独秀 浓眉盼健康

体坛周报 浏览 35 10-21

斯洛伐克总理:斯洛伐克不会参与在乌克兰的任何军事任务

国际在线 浏览 112 09-13

卡瓦略:特里、兰帕德、德罗巴等都尊重穆里尼奥,因为我们都想赢

直播吧 浏览 4094 07-28

今日热点:BLACKPINK九周年合照;迪丽热巴体制内妈妈降临……

伊周潮流 浏览 10005 08-09

Nature重磅:AI又一突破!穿越千年,填补人类缺失的历史

学术头条 浏览 4315 07-24
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11