关闭广告

武汉大学让AI学会诊断金融知识:像医生检查身体一样评估AI模型

科技行者2025-09-10 00:00:02161人阅读


这项由武汉大学人工智能学院的谢倩倩教授领导的研究团队在2025年8月发表,论文题为《From Scores to Skills: A Cognitive Diagnosis Framework for Evaluating Financial Large Language Models》,该研究首次将教育心理学中的认知诊断理论引入到金融AI评估领域。有兴趣深入了解的读者可以通过GitHub项目页面https://github.com/WHUNextGen/FinCDM访问完整研究成果。

当我们去医院体检时,医生不会只告诉你"身体状况70分"就完事,而是会详细检查你的心脏、肝脏、肺部各个器官的具体情况,告诉你哪里健康、哪里需要注意。但令人意外的是,在评估金融AI模型时,我们却一直在用那种简单粗暴的"总分"方式。

考虑这样一个场景:两个学生都考了80分,但一个是因为数学好语文差,另一个是语文好数学差。如果只看总分,我们永远不知道该给他们推荐什么样的补习班。武汉大学的研究团队发现,评估金融AI模型时也存在完全相同的问题。目前所有的评估方法都只给出一个总体得分,比如"在金融问答任务上准确率85%",但这个分数完全无法

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

"普特会"前 欧洲欲与乌克兰划出"共同红线"

参考消息 浏览 5683 08-11

靠“给血管做彩超”,这群“80后学霸”干出一个IPO!

野马财经 浏览 4719 07-17

三年打入越南Top 5,这家纸巾厂的出海秘诀是什么?

虎嗅APP 浏览 38 10-20

数十架飞机被扣俄罗斯 有公司计提减值损失57.8亿元

第一财经资讯 浏览 9323 08-13

深圳联通官宣可预约上门办理eSIM业务,暂定截至10月31日

IT之家 浏览 22 10-21

拥抱变局!2025外滩年会揭幕,聚焦新秩序、新科技

国际金融报 浏览 23 10-25

Neuralink宏伟蓝图:到2031年年收入达10亿美元

财联社 浏览 4044 07-24

深圳机器人上街劝导乱摆卖,“上岗”第一天成功劝离摊贩

南方都市报 浏览 208 08-24

金山办公放不下协同梦

光子星球 浏览 225 08-21

江西“星火一号”项目计划2029年底完成装置建设,2030年演示发电

IT之家 浏览 4980 08-10

35+款漂亮包包!百搭好看!挑花眼了!

Yuki女人故事 浏览 5992 07-28

朝鲜军需工业副部长李亨先被拘留

央视新闻客户端 浏览 10252 05-27

对话一线保险人|新职业养老服务师:补位“保险+养老”生态核心拼图

蓝鲸Insurance 浏览 227 08-14

乘客拍下飞机上有人多次吸电子烟 厦航回应

极目新闻 浏览 6519 06-19

琶洲“模术”秀专访:大模型不必“大而全”,也可“小而美”

南方都市报 浏览 205 08-22

《南京照相馆》高叶的“衣衫不整”申奥处理过,但真相令全网泪崩

娱乐圈笔娱君 浏览 3210 07-29

1000亿美元!华人干出全球第四大AI独角兽

智东西 浏览 219 08-21

许绍雄情况不乐观!黄宗泽低调现身,佘诗曼落泪取消行程前往医院

萌神木木 浏览 18 10-28

印客机坠毁:飞机仅飞了五分钟 飞行员曾发"求救"信号

环球时报 浏览 9687 06-13

优质智能体验/1.5T增程 别克至境L7正式亮相

网易汽车 浏览 105 09-17

王凯“客串”这段在全网火了!叶祖新的评价,终于有人信了

温柔娱公子 浏览 8253 07-08
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11