关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者2026-01-11 00:00:01272人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

智能化短板补齐/舒适性加分 岚图FREE+6月21日下线

网易汽车 浏览 414 06-23

沉浸式感受"正义使命-2025"演习现场

环球网资讯 浏览 178 01-01

特朗普升级打击美国清洁能源业,计划撤销马里兰州60亿美元海上风电项目

华尔街见闻官方 浏览 486 08-26

秋到没边的氛围感美甲,一眼心动

时尚COSMO 浏览 227 10-23

43岁女子遭前夫殴打住进ICU后死亡 警方:嫌犯被逮捕

界面新闻 浏览 466 09-08

52岁男星赔了3.8亿!沉迷炒币不愿脱身,网友直言很难有好下场

萌神木木 浏览 273 10-13

中小银行再降息!存款“搬家”涌入股市?

国际金融报 浏览 445 08-22

圣坛夺冠!刘圣书/谭宁2-1力克马来西亚组合,首夺世锦赛女双冠军

直播吧 浏览 335 09-01

仅17.98万元起 纯电大三排SUV乐道L90上市

网易汽车 浏览 6672 08-02

U20世界杯4强出炉

体坛周报 浏览 299 10-13

53岁蔡晓仪退圈20年宣布复出,身材微胖仍自信

小撇说事 浏览 893 07-15

产业协同提速,中国智能汽车迈向“认知驱动”新时代

钛媒体APP 浏览 1678 07-24

美国务卿批准向中东国家出售价值258亿美元的武器

国际在线 浏览 31 05-08

聚力攻坚先进封装!长电科技上半年营收超186亿元,锚定高附加值市场

时代周报 浏览 416 08-23

命运的转折点,2025年英伟达入股英特尔=1997年微软入股苹果?

华尔街见闻官方 浏览 315 09-20

雷军:小米YU7的价格不会只比SU7高2万

网易汽车 浏览 501 06-06

美军突袭抓获马杜罗 三个细节值得关注

上观新闻 浏览 196 01-05

伊姐周日热推:电视剧《吴邪私家笔记》;电视剧《灼灼韶华》......

伊周潮流 浏览 287 09-22

小德:我的25个大满贯冠军和C罗的1000个进球也许能一起实现

懂球帝 浏览 205 12-29

淘宝即将上线大会员体系:打通饿了么、飞猪、盒马

第一财经资讯 浏览 5723 08-06

AI是繁荣还是泡沫?哈佛学者剖析OpenAI千亿交易背后的风险

硅星人 浏览 282 10-18
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11