关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者2025-10-22 00:00:02106人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

中国女游客潜水被酒店船只遗忘 经历"绝望"35分钟

封面新闻 浏览 232 09-16

打破场景界限,波司登与Kim Jones的合作让冬天更体面

时尚COSMO 浏览 76 10-29

今夏流行“不穿裤子”?显高显腿长,太撩了!

Yuki女人故事 浏览 7061 06-20

韦韬任广西壮族自治区代主席 曾在广西工作多年

政知新媒体 浏览 2759 07-04

信号来了!消费基金,出现新动向!

券商中国 浏览 196 09-10

美开应答机运核武器 俄准备全面对抗

央视新闻客户端 浏览 7612 07-31

派系纷争不断 加沙秩序恢复仍需时间

极目新闻 浏览 85 10-26

黄仁勋:不必担心中国军方会使用英伟达芯片

环球网资讯 浏览 2692 07-15

具身智能,为何成为智驾公司的下一个战场?

雷峰网 浏览 161 09-26

媒体:一份非官方的美国就业数据 把美国投资者吓坏了

财联社 浏览 56 11-08

消息称SK海力士与英伟达达成HBM4供应协议,价格较上代上涨50%

IT之家 浏览 60 11-06

不愧牛市!证券公司赚疯了,有人利润翻5倍

说财猫 浏览 66 11-03

前曼城助教:08年曼城曾为梅西报价3000万镑,这惹怒了巴萨

懂球帝 浏览 9 12-16

CLTC续航550km iCAR V23长续航版破解里程焦虑

汽车找茬 浏览 256 06-23

“安我股保”假保险的真骗局 传销式推广暗藏陷阱

北京商报 浏览 36 11-27

何小鹏“扒皮”验真身 国产人形机器人“摊牌了”

汽势传媒 浏览 51 11-11

依旧自信!费尔斯谈菜鸟赛季目标:赢40-50场比赛 拿最佳新秀

直播吧 浏览 264 08-21

商务部回应美方滥用出口管制措施

浏览 7678 07-14

维埃拉:热那亚和争冠球队交锋时踢得很勇敢,年轻人成长需要时间

直播吧 浏览 210 09-01

美俄元首会谈地"全副武装" 数百特工入驻

红星新闻 浏览 266 08-16

内装豪华感提升 小鹏X9增程版内饰发布

网易汽车 浏览 101 10-26
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11