关闭广告

马里兰大学团队让3.5B参数小模型媲美50B大模型的推理能力

科技行者2025-08-27 00:00:01213人阅读


这项由马里兰大学计算机科学系的Jonas Geiping和Tom Goldstein教授领导的研究团队发表于2025年2月的突破性研究,首次展示了一种全新的人工智能思维方式。该研究论文《用潜在推理扩展测试时计算:一种循环深度方法》可通过arXiv:2502.05171v2获取完整内容。研究团队还包括来自图宾根大学、劳伦斯利弗莫尔国家实验室等多个机构的研究人员,他们开发的模型代码已在GitHub开源,训练好的模型也在HuggingFace平台公开可用。

设想一下这样的场景:当你遇到复杂问题时,不是立刻脱口而出答案,而是在心中反复思考、推演,直到想透彻了才开口。研究团队发现,现有的AI模型就像那些总是急于回答的学生,缺乏深度思考的能力。它们通常要么依靠庞大的参数量来"强记硬背",要么需要把思维过程完全用文字表达出来,就像必须把所有想法都写在草稿纸上一样繁琐。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

米体:米兰新赛季可能将主打三后卫阵型,仍需引进新中卫&新中锋

直播吧 浏览 2528 07-30

可耐受 2600℃ 高温,中国科研团队研发新型碳纳米管薄膜材料

IT之家 浏览 225 08-31

"小白鞋过时了!今秋最火的是这4双鞋,百搭显瘦还偷偷增高

Yuki女人故事 浏览 153 09-12

多辆无人驾驶出租车在洛杉矶被烧毁 损失或超60万美元

澎湃新闻 浏览 3031 06-10

AMD Ryzen Threadripper PRO 9000 WX系列处理器正式发售:售价13955元起

超能网 浏览 9745 07-25

美国施压澳大利亚增加军费 中国驻澳大使撰文提醒

环球网资讯 浏览 2619 07-01

长城汽车超豪车BG品牌开启招标报名工作

经济观察报 浏览 271 08-21

以色列:未要求美国参战

环球时报新闻 浏览 951 06-24

94岁股神巴菲特宣布年底退休 已指定"接班人"

每日经济新闻 浏览 2024 05-05

宗庆后弟弟曾公开对宗馥莉表达不满 揭露娃哈哈"大雷"

蓝鲸新闻 浏览 1814 07-18

健康第一,卢:伦纳德目前身体状况正佳,希望他能保持住

懂球帝 浏览 111 10-11

媒体:美军武器靠拆零件续命 对美国或是一种致命伤

新民周刊 浏览 94 10-21

小米总裁卢伟冰:尚未看到人形机器人商业闭环的时间点

南方都市报 浏览 248 08-20

皮克福德点球小抄失效,球迷:小抄上没写恩梅加的罚点习惯

懂球帝 浏览 274 08-19

带队4战全胜,杭州临平吴越主帅许磊当选中乙6月最佳教练

懂球帝 浏览 2615 07-18

司机追尾玛莎拉蒂 保险公司拒理赔:车险还差7分钟生效

潇湘晨报 浏览 308 08-17

红军枪手一同庆祝!天空:曼城输球时,安菲尔德球场内响起欢呼声

直播吧 浏览 210 09-01

弗拉门戈巴甲8-0大胜维多利亚,是巴甲历史并列第三大比分胜利

直播吧 浏览 250 08-26

小S面临危机!制作人否认复工,力挺吴姗儒代班还要改节目模式

萌神木木 浏览 3646 07-30

财经早餐:美国已与欧盟达成15%税率的关税协议;美股三大指数上周五集体收涨

网易财经 浏览 7928 07-28

美日同盟下的暗流:广岛阴影与日本的双重姿态

浏览 5093 07-14
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11