关闭广告

香港科技大学团队发现形式化验证如何让AI推理更聪明

科技行者2026-02-04 00:00:01195人阅读


这是一个关于人工智能如何学会更好地思考的故事。想象一下,你在教一个聪明但有点"散漫"的孩子做数学题。这个孩子通常能猜对答案,但他的推理过程常常有漏洞——他会说"因为看起来对所以就对了",而不是真正理解为什么。如今,来自香港科技大学、上海人工智能实验室、浙江大学和香港浸会大学的研究团队发现了一个巧妙的办法,让这个"散漫的孩子"学会了像数学家一样严谨地思考。这项研究发表于2026年1月,论文编号为arXiv:2601.22642。

这个故事的核心很有趣:当今最强大的语言模型,比如ChatGPT和Claude,在处理复杂推理问题时,常常会犯一个致命的错误。它们会生成看似合理但逻辑上存在严重漏洞的答案。研究人员的发现更是令人担忧——即使在最终答案是对的情况下,推理过程中有39.3%的步骤在形式化验证中被"驳回"了。而当答案错误时,这个比例甚至高达52.4%。这就像一个学生虽然最后得到了正确答案,但他的计算过程完全是错的——纯粹是靠运气或者模式识别碰巧得对了。

研究团队的创新之处在于,他们不是简单地让AI生成答案就完事,而是在推理的每一步都加入了一个"严厉的数学老师"——形式化验证系统。这个"老师"会实时检查每

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

理想侵权“ 歼-20”等军机,涉虚假宣传,被要求道歉!

电动知家 浏览 359 09-25

新版微信输入法体验:比iOS键盘更好用,藏着微信AI的野心?

雷科技 浏览 525 08-13

博主爆料:皇马将与漫威合作,赛季晚些时候推出特别款系列

直播吧 浏览 3732 07-18

刘谦自曝患肺腺癌,但他是幸运的

网易健康 浏览 1647 08-29

每体:哥伦比亚小将内塞尔决定去克鲁塞罗,巴萨曾对其感兴趣

懂球帝 浏览 387 09-20

深夜觉醒!资本大佬开始加速套现

米筐投资 浏览 1137 08-07

张建勇、张国富等22人增持北汽蓝谷 刘观桥增持花了4年工资

道哥说车 浏览 235 01-14

媒体:莫迪到天津参加一场国际峰会 结果惹得有人吃醋

新民周刊 浏览 431 09-02

46岁侯佩岑和51岁朱迅站在一起 顶级骨相绝了

新语爱八卦 浏览 1250 07-17

材料学新突破,科学家在陨石中发现奇异矿物

网易科技报道 浏览 932 08-14

今年秋天最火的5个叠穿公式,怎么搭都好看!

LinkFashion 浏览 330 09-06

科创板80后总经理被留置,去年年薪337万!董事长是A股最不服老的老板

深蓝财经 浏览 483 08-21

【夏窗截止日】1.3亿镑伊萨克HWG!拉比奥特→米兰,杰克逊去哪?

直播吧 浏览 418 09-01

全系标配四驱 领克10 EM-P申报图曝光

网易汽车 浏览 5724 06-24

中女超第12轮:武汉女足3-1江苏无锡女足,王霜点射&邓梦晔双响

直播吧 浏览 4327 07-24

她新婚就分居?她头发越剪越短?她的穿搭一言难尽?

Yuki女人故事 浏览 1304 07-28

开价185亿,刘强东竞买德国超市

21世纪经济报道 浏览 5899 07-26

男子开车出车祸致25岁女友截瘫 承诺结婚后全家失联

极目新闻 浏览 3473 07-09

福建舰未来还会搭载哪些新型舰载机 专家解析

北京日报客户端 浏览 385 09-28

行星探测工程天问二号任务将发射 任务周期长达九年半

扬子晚报 浏览 10292 05-27

赵丽颖玩大了!《小城大事》预告信息量炸裂,不愧是争剧王的大剧

娱乐圈笔娱君 浏览 226 01-06
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11