关闭广告

武汉大学让AI学会诊断金融知识:像医生检查身体一样评估AI模型

科技行者2025-09-10 00:00:02219人阅读


这项由武汉大学人工智能学院的谢倩倩教授领导的研究团队在2025年8月发表,论文题为《From Scores to Skills: A Cognitive Diagnosis Framework for Evaluating Financial Large Language Models》,该研究首次将教育心理学中的认知诊断理论引入到金融AI评估领域。有兴趣深入了解的读者可以通过GitHub项目页面https://github.com/WHUNextGen/FinCDM访问完整研究成果。

当我们去医院体检时,医生不会只告诉你"身体状况70分"就完事,而是会详细检查你的心脏、肝脏、肺部各个器官的具体情况,告诉你哪里健康、哪里需要注意。但令人意外的是,在评估金融AI模型时,我们却一直在用那种简单粗暴的"总分"方式。

考虑这样一个场景:两个学生都考了80分,但一个是因为数学好语文差,另一个是语文好数学差。如果只看总分,我们永远不知道该给他们推荐什么样的补习班。武汉大学的研究团队发现,评估金融AI模型时也存在完全相同的问题。目前所有的评估方法都只给出一个总体得分,比如"在金融问答任务上准确率85%",但这个分数完全无法

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

中东多地庆祝伊朗反击 巴基斯坦防长呼吁团结

看看新闻Knews 浏览 9184 06-18

文创产品被指"拿民族伤痛开玩笑" 上海博物馆称在处理

封面新闻 浏览 7354 07-10

印度恢复向中国公民发放旅游签证

财联社 浏览 7875 07-24

因场地积水严重,欧协联里耶卡vs布拉格斯巴达比赛被迫延期

懂球帝 浏览 97 10-24

特斯拉创13年单季营收最大降幅,马斯克遭遇新烦恼

国际金融报 浏览 5918 07-29

问界M7改款、小鹏首款增程亮相!这批申报新车太有料了

电车通 浏览 2125 08-10

净息差与不良率首次"倒挂" 银行赚钱更难了

中国新闻周刊 浏览 3593 07-21

特斯拉自研芯片Dojo叫停原因揭秘:所有努力都将集中在AI6芯片

财联社 浏览 327 08-12

伊朗核设施遭美军袭击前后对比

环球网资讯 浏览 1817 06-23

专家:美俄总统会谈未达成协议是“体面的失败”

每日经济新闻 浏览 274 08-17

2025款岚图FREE+新车商品性评价

车质网 浏览 81 10-25

农民工如厕被误当猎物枪击身亡:打工为女儿筹婚礼钱

极目新闻 浏览 4527 08-08

火箭用联盟97换联盟第十!KD能力值衬斯通妙手:单打效率联盟封王

颜小白的篮球梦 浏览 1502 07-28

150余封加税函威胁,同步推进高压谈判,特朗普的策略能否奏效

第一财经资讯 浏览 1143 07-18

全球罕见 中国医生救回“身首离断”患者

潇湘晨报 浏览 316 08-18

李湘没想到,前夫王岳伦竟走了另一条“上坡路”

暮云晨记 浏览 2747 07-10

詹姆斯:NBA应设立年度最佳进攻球员奖 就像NFL那样

直播吧 浏览 9121 07-22

得了口腔黏膜病,真的会传染么?

网易健康 浏览 6593 04-18

西贝鸡汤配料被扒:种类太多 顾客直言"尝不出鸡汤味"

新民晚报 浏览 191 09-15

或搭载华为ADS!零跑接洽华为,只因“去理想化”是正确道路?

电车通 浏览 6672 08-07

证监会,批了!券业又一并购拿下批文

券商中国 浏览 260 08-23
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11