关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者2025-10-22 00:00:02296人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

四缸AMG失败史:干掉C63!

CLauto酷乐汽车 浏览 144 03-16

二季度外资公募机构动向揭晓 多维策略揭示A股市场结构性机会

财联社 浏览 8807 07-25

德国癌症研究中心等机构开发新型AI工具,可预测超1000种疾病风险

IT之家 浏览 315 09-21

小米智能门锁 4 Pro 双摄版发布,预售价 2464.15 元

IT之家 浏览 319 10-11

帅炸了!华为Pura 90 Pro Max首发光感无界主题:长按锁屏手机秒变透明

快科技 浏览 87 04-22

CUDA内核之神、全球最强GPU程序员?OpenAI的这位幕后大神是谁

机器之心Pro 浏览 337 10-02

在景区遇害者系外交学院大一女生 同学称其被捅十多刀

澎湃新闻 浏览 5492 08-13

申花亚冠赛季首胜!连战蔚山首尔不败,阿苏埃建功,延续5大纪录

奥拜尔 浏览 279 10-23

美防长:战事不会“没完没了”

环球网资讯 浏览 68 04-25

卫衣+百褶裙,初秋最韩系穿搭,又美又撩人!

Yuki女人故事 浏览 265 11-05

瞄准重卡客车三电难题,福田发布爱易科新能源重型超级电驱动

钛媒体APP 浏览 1043 07-31

还是不想走!ESPN:霍伊伦不想离开曼联,但他怕不转会没出场机会

直播吧 浏览 8075 08-14

王思聪带新女伴游玩!前任懒懒仍在日本发文示爱

娱乐团长 浏览 443 08-23

梁朝伟谈《寂静的朋友》,它“改变了我与自然的关系”

幕味儿 浏览 244 11-05

输水晶宫,斯洛特怨弗林蓬爱进攻?

体坛周报 浏览 344 09-29

太猛了!保险巨头炒股竟大赚300多亿

财通社 浏览 276 10-20

上汽尚界H5将杀入20万级市场 华为ADS 4首度普惠

大侠上车 浏览 1999 07-26

伊朗:将打击美在中东地区的所有利益

财联社 浏览 2960 06-23

这一天,35岁李沁秒了28岁陈哲远,才知李少红当年的眼光有多绝

温柔娱公子 浏览 228 10-14

国际空间站2030年退役,多个商业项目或接棒,NASA将迎来“后空间站时代”

环球网资讯 浏览 375 09-10

仅100台!微软悄悄推出蓝精灵限量版Surface Laptop:贵了700元

快科技 浏览 815 07-31
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11