关闭广告

武汉大学让AI学会诊断金融知识:像医生检查身体一样评估AI模型

科技行者2025-09-10 00:00:02397人阅读


这项由武汉大学人工智能学院的谢倩倩教授领导的研究团队在2025年8月发表,论文题为《From Scores to Skills: A Cognitive Diagnosis Framework for Evaluating Financial Large Language Models》,该研究首次将教育心理学中的认知诊断理论引入到金融AI评估领域。有兴趣深入了解的读者可以通过GitHub项目页面https://github.com/WHUNextGen/FinCDM访问完整研究成果。

当我们去医院体检时,医生不会只告诉你"身体状况70分"就完事,而是会详细检查你的心脏、肝脏、肺部各个器官的具体情况,告诉你哪里健康、哪里需要注意。但令人意外的是,在评估金融AI模型时,我们却一直在用那种简单粗暴的"总分"方式。

考虑这样一个场景:两个学生都考了80分,但一个是因为数学好语文差,另一个是语文好数学差。如果只看总分,我们永远不知道该给他们推荐什么样的补习班。武汉大学的研究团队发现,评估金融AI模型时也存在完全相同的问题。目前所有的评估方法都只给出一个总体得分,比如"在金融问答任务上准确率85%",但这个分数完全无法

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

快手亮出流量底牌

虎嗅APP 浏览 410 09-01

2024年最赚钱的车企,有家车企销量下滑,利润最高

星星car 浏览 423 05-26

辽宁加时95-82江苏,赵继伟16+7+8,威尔斯21分

懂球帝 浏览 206 02-04

富佳股份:“一体两翼”战略显效,储能+机器人业务成增长新引擎

览富财经网 浏览 447 08-26

亲属确认失联18岁女孩意外溺亡:被面包车拉走系谣言

南方都市报 浏览 4335 08-14

媒体:中国反制手段出现新变化 背后的信号非常清楚

上观新闻 浏览 678 09-11

巴黎客战布雷斯特:阿什拉夫、巴尔科拉首发, 登贝莱替补

懂球帝 浏览 308 10-26

现场调查!拥有“黄金”招牌的金雅福爆雷后人去楼空,“买卖+委托”模式是否涉嫌非法吸存

华夏时报 浏览 220 01-02

冲劲十足!13号秀奎因半场8中4砍全队最高11分外加5板 也有5失误

直播吧 浏览 1711 07-16

年内港股五起IPO超百亿,规模最大车企上市,再搅动投行江湖

科创板日报 浏览 399 09-26

猥亵继女的上海民警获刑8年 曾威胁继女报警就杀了她

潇湘晨报 浏览 618 08-12

2岁多女童失踪 父亲:孩子在家门口玩耍几分钟就不见了

极目新闻 浏览 594 08-23

魏牌9年换9帅,魏建军:他们自己感觉压力大

雷达财经 浏览 247 12-24

Aqara绿米推出U400智能锁:自带UWB超宽带,可实现无感解锁

IT之家 浏览 230 01-07

欧盟称TikTok将欧洲用户数据转存中国服务器 中方回应

外交部网站 浏览 4920 07-12

《小城大事》:那么宏大,却又那么儿戏,我还是弃剧了

娱乐圈笔娱君 浏览 214 01-18

柜姐跳槽当主播:被要求穿低胸衣擦边 12天赚了200元

南方都市报 浏览 1086 07-17

做好这几招,惊蛰不“惊”春归不“敏”

网易健康 浏览 6145 05-31

古巴称特朗普发出“明确且直接的军事侵略威胁”

上观新闻 浏览 55 05-03

武契奇检阅部队宣布获得“绝密”武器装备 仅5人知晓

参考消息 浏览 7440 06-25

阅兵准备基本就绪 已经进入倒计时

新华社 浏览 364 08-29
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11