关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者2025-10-22 00:00:02293人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

俄美乌新一轮三方会谈将举行 只剩一个问题却是死结

新民晚报 浏览 199 02-04

零食连锁被困愁城

海克财经 浏览 1887 07-31

普通人衣服没必要买太多,准备好这些实用的单品,百搭又舒适

静儿时尚达人 浏览 263 10-30

全网独家!九三阅兵全图鉴

网易新闻出品 浏览 377 09-04

牛文文:中国企业这一套打法,在海外所向披靡

创业家 浏览 387 09-21

郑钦文晒照新教练技改,外媒称其剑指法网阳光双赛成绩是合作关键

网球之家 浏览 185 03-03

华硕无畏Pro16 2025福利来袭:AI轻薄本高能体验,到手6399.2元

IT之家 浏览 7541 08-12

售35.98万元起 第二代腾势D9正式上市

网易汽车 浏览 58 04-29

曲协表态仅6天,郭德纲担心的事还是发生

科学发掘 浏览 201 12-19

倍耐力官方:下赛季取消C6;所有车队将在12月9日测试新胎

懂球帝 浏览 247 11-25

胡金秋:整场比赛大家打得都很拼,回去会好好总结我们的不足

懂球帝 浏览 9643 08-06

科幻悬疑剧《不眠日》将至,白敬亭饰最飒刑警

最爱酷影视 浏览 459 08-24

中国第42次南极考察启航

环球网资讯 浏览 235 11-01

"4只皮皮虾1035元"店主事发次日病逝 家属:不再开业

扬子晚报 浏览 56 05-09

人工巡防有盲区、适老设计待完善 人大代表呼吁AI赋能社区养老

贝壳财经 浏览 221 01-27

镰田大地:现在水晶宫无论踢谁都有竞争力 膝盖伤势感觉并不严重

直播吧 浏览 507 08-11

芯片圈“大佬”IPO梦碎,牵出千万受贿案!

野马财经 浏览 288 10-22

食品价格拖累8月CPI同比由平转降 PPI同比降幅收窄

澎湃新闻 浏览 379 09-11

联合国:加沙人道救援物资需求缺口依旧巨大

国际在线 浏览 443 08-21

突发!科兴制药拟赴港IPO

财通社 浏览 446 08-23

攀枝花市民吐槽公交站台被护栏拦住:上下车要"跨栏"

封面新闻 浏览 4522 07-13
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11