关闭广告

武汉大学让AI学会诊断金融知识:像医生检查身体一样评估AI模型

科技行者2025-09-10 00:00:02394人阅读


这项由武汉大学人工智能学院的谢倩倩教授领导的研究团队在2025年8月发表,论文题为《From Scores to Skills: A Cognitive Diagnosis Framework for Evaluating Financial Large Language Models》,该研究首次将教育心理学中的认知诊断理论引入到金融AI评估领域。有兴趣深入了解的读者可以通过GitHub项目页面https://github.com/WHUNextGen/FinCDM访问完整研究成果。

当我们去医院体检时,医生不会只告诉你"身体状况70分"就完事,而是会详细检查你的心脏、肝脏、肺部各个器官的具体情况,告诉你哪里健康、哪里需要注意。但令人意外的是,在评估金融AI模型时,我们却一直在用那种简单粗暴的"总分"方式。

考虑这样一个场景:两个学生都考了80分,但一个是因为数学好语文差,另一个是语文好数学差。如果只看总分,我们永远不知道该给他们推荐什么样的补习班。武汉大学的研究团队发现,评估金融AI模型时也存在完全相同的问题。目前所有的评估方法都只给出一个总体得分,比如"在金融问答任务上准确率85%",但这个分数完全无法

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

BBC:努诺与诺丁汉森林老板关系破裂,帅位并不稳固

直播吧 浏览 436 08-23

美国政府效率部提前解散

北京商报 浏览 229 11-25

吉利长城们为什么要死磕比亚迪

汽势传媒 浏览 479 06-11

2026,什么样的企业家还能留在牌桌上?

雪豹财经社 浏览 201 02-03

媒体:泰国新总理是一个狠人 如何保持对华关系成考验

南风窗 浏览 412 09-10

联通三季报:宽移用户净增规模创新高,首次披露云收入数字

南方都市报 浏览 331 10-23

观众对白百何的评价,明白了当年宋丹丹那番话

娱乐圈笔娱君 浏览 182 11-12

特朗普政府加剧美国矛盾和分裂

浏览 154782 09-26

默茨正式当选德国新任总理

央视新闻客户端 浏览 10265 05-07

48岁的李维嘉消失多年,近况再出令人唏嘘

动物奇奇怪怪 浏览 6430 07-28

8155芯片+L2智驾 瑞虎5运动版上市 置换补贴价6.79万元起

网易汽车 浏览 105 04-10

方程豹6月销量近19000辆 钛3月销破万/钛7即将发布

网易汽车 浏览 1398 07-03

阮奇龙庆祝冲超:美好的一个赛季,一起期待2026新的挑战

懂球帝 浏览 222 11-10

WTT总决赛男单决赛前,张本智和接受采访时引用高市早苗言论

懂球帝 浏览 209 12-16

日本多地严重缺水 水稻产区面临“新米危机”

浏览 155657 09-26

身价第一的全球大网红“野兽先生”哭穷,为啥?

喜欢历史的阿繁 浏览 343 09-29

全球最大稳定币遭质疑 标普将评级降至“最差一档”

财联社 浏览 226 11-27

美记:绿军对交易安芬尼-西蒙斯持开放态度 但也没有到处打电话

直播吧 浏览 1057 07-15

2岁女童家门口失踪10多天 在离家3公里山上石缝中离世

红星新闻 浏览 438 09-21

法拉第未来官宣10月8日交付下一台 FF 91 2.0 Futurist Alliance

IT之家 浏览 369 09-26

残暴!温网女单决赛首盘,斯瓦泰克仅耗时25分钟&6-0取胜!

直播吧 浏览 1379 07-13
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11