关闭广告

武汉大学让AI学会诊断金融知识:像医生检查身体一样评估AI模型

科技行者2025-09-10 00:00:02216人阅读


这项由武汉大学人工智能学院的谢倩倩教授领导的研究团队在2025年8月发表,论文题为《From Scores to Skills: A Cognitive Diagnosis Framework for Evaluating Financial Large Language Models》,该研究首次将教育心理学中的认知诊断理论引入到金融AI评估领域。有兴趣深入了解的读者可以通过GitHub项目页面https://github.com/WHUNextGen/FinCDM访问完整研究成果。

当我们去医院体检时,医生不会只告诉你"身体状况70分"就完事,而是会详细检查你的心脏、肝脏、肺部各个器官的具体情况,告诉你哪里健康、哪里需要注意。但令人意外的是,在评估金融AI模型时,我们却一直在用那种简单粗暴的"总分"方式。

考虑这样一个场景:两个学生都考了80分,但一个是因为数学好语文差,另一个是语文好数学差。如果只看总分,我们永远不知道该给他们推荐什么样的补习班。武汉大学的研究团队发现,评估金融AI模型时也存在完全相同的问题。目前所有的评估方法都只给出一个总体得分,比如"在金融问答任务上准确率85%",但这个分数完全无法

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

媒体:俄客机的失事很不幸在预料之中

观察者网 浏览 6852 07-26

从时尚秀场到私藏衣橱,“格拉斯玫瑰”如何成为最新的香气风潮?

LinkFashion 浏览 189 09-11

45岁,她“赢得”一场令人激动的失败

界外编辑部 浏览 263 08-26

理想汽车、中国汽研、东风柳汽就理想i8碰撞测试事件发布联合声明

网易财经 浏览 9185 08-07

陈晓离婚不到半年就又曝新欢?

深析古今 浏览 288 08-20

小托马斯:巅峰威少比库里和欧文还要难防

懂球帝 浏览 119 10-13

46岁朱孝天自曝患病!同意F4合体是怕以后没机会,坦言时间不多了

萌神木木 浏览 4338 07-17

长和港口交易拟邀请中国内地主要策略投资者加入

界面新闻 浏览 3695 07-28

官方推进预制菜国家标准制定

央视新闻客户端 浏览 165 09-22

美驻华使馆发布"逆天言论":美日携手结束太平洋战争

扬子晚报 浏览 6353 08-09

低价“银行直供房”激增,有房产价格低于市价25%

第一财经 浏览 50 11-10

乌军突袭俄本土,普京面临严峻挑战

浏览 9361 07-14

近期石柯社媒频繁更新?他已签约成为杭州致禾文化旗下艺人

懂球帝 浏览 102 10-16

琉球群岛地位未定中方在联合国亮明态度 日媒破防

头条爆料007 浏览 43 11-12

飞檐走壁"猴哥"闯进小区多日 居民开启直播播报其行踪

极目新闻 浏览 97 10-20

金融合辑 | WAIC 2025:AI驱动金融全链路生态探索新范式

观察者网 浏览 5197 07-16

车企“偷换”电池背后:产能不足还是另有隐情

经观汽车 浏览 94 10-26

德保罗社媒晒照:身披这身球衣80次出场令人激动,这是曾经的梦想

直播吧 浏览 180 09-10

阿富汗6级地震数千死 村民17名家人被埋:以为世界末日

中国新闻周刊 浏览 230 09-10

22记三分浇灭黎巴嫩!韩国八强资格赛将战关岛 胜者对阵中国

直播吧 浏览 275 08-11

继“车道级广告”后,百度地图又被曝打车还得看广告

三言科技 浏览 242 09-01
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11