关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者2025-10-22 00:00:02295人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

19岁女孩当"台球美女助教" 月入过万被客人开黄色玩笑

极目新闻 浏览 3427 08-11

H20芯片开卖即叫停,英伟达如何解围?

节点财经 浏览 478 08-26

许利民:如此困难的情况下大家坚持到了最后,取胜全靠精神力

懂球帝 浏览 201 01-23

售14.98万起 2026款海豹07DM-i正式上市

网易汽车 浏览 379 09-17

科莫省报:热刺曾为帕斯报价4000万欧被拒,暂时还没有新报价

懂球帝 浏览 435 08-23

腾势汽车12月销售18139辆 全年累计157134辆

网易汽车 浏览 223 01-04

苗春生:泥塑的脉动 | 陕西守艺人

粉巷财经 浏览 4092 07-18

朱啸虎:我当年为什么那么早就投了小红书?

创业家 浏览 6427 08-07

陈楚生爆冷拿下"歌王"后引争议:我也希望我是"皇"

红星新闻 浏览 9822 08-10

TVB女星刘佩玥被男粉摸臀!全场吓懵

橙星文娱 浏览 9472 07-26

还真赔了!比亚迪智能泊车“第一赔”出现,但没想到是这款车

小李车评李建红 浏览 511 08-12

看到洪水冲毁花莲桥梁大声讪笑 台官员被批"冷血"

澎湃新闻 浏览 454 10-09

把个体才华转化为产业合力,内容创作者们缘何青睐“V聚场”?

澎湃新闻 浏览 4376 07-14

以色列:未要求美国参战

环球时报新闻 浏览 1151 06-24

全球票房目标180 亿?《超人》国内预售仅137万,远不如侏罗纪

最爱酷影视 浏览 8972 07-09

记者:阿森纳和利物浦也有意哈托,但切尔西处于争夺战领先地位

直播吧 浏览 3778 07-17

西足协主席谈亚马尔:本应处理得更好,重要的是照顾好球员

懂球帝 浏览 270 11-12

未拴绳大狗冲向6个月孕妇 当事人:狗主人冷漠 没道歉

封面新闻 浏览 512 08-25

“Polo衫+牛仔裤”今年火爆了,这样穿时髦松弛又减龄!

LinkFashion 浏览 959 07-18

仅播一晚,收视率破2,不愧是你们盼了2年的古装大剧

娱乐圈笔娱君 浏览 3013 08-07

业界首个,腾讯混元 3D 世界模型正式发布并开源

IT之家 浏览 8629 07-27
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11