关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者2026-01-11 00:00:01275人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

复盘西贝风波:连锁餐饮的规模陷阱

有数DataVision 浏览 344 09-22

“科瑞系”郑跃文和女明星搞内幕交易,亏了钱还双双被抓!

野马财经 浏览 427 09-10

吴易昺谈晋级16强:自己越打越好了,不是很担心排名方面的事情

直播吧 浏览 7279 07-24

哈马斯回应加沙停火提案 美称"不可接受"以称继续行动

央视新闻客户端 浏览 7625 06-01

2026款福特锐界L来袭 关键是一箱油能跑1188公里

车之养护 浏览 344 09-23

记者问批评球员是否担心更衣室反对,穆帅:你爸对你永远都很好?

懂球帝 浏览 229 11-25

北京移动致歉

第一财经资讯 浏览 8819 08-13

记者:米兰与国米有意签下德温特,但谈判尚处于早期阶段

懂球帝 浏览 4673 08-11

全链条协同下,科技成果如何走出实验室?钟南山院士:双转化、双推广至关重要

时代财经 浏览 472 08-25

身高1米96大男孩喜提清华录取通知书

红星新闻 浏览 875 07-15

王浩然第二阶段再进步!展露持球和突破能力,若补强防守还了得?

篮球资讯达人 浏览 118 04-10

国庆"被弃高速"的小狗主人找来了 主人:不是故意丢弃

红星新闻 浏览 399 10-09

量子信息技术与应用专题论坛在京举办

环球网资讯 浏览 4866 07-14

2025服贸会| 从规模扩张转向质量提升,品质才是电商竞争的护城河

北京商报 浏览 408 09-11

贵州"天下第一水司楼"已变身酒店:最贵房型2321元1晚

红星新闻 浏览 364 09-26

沈腾林允绯闻再添新料!两人前后现身偏僻公园

古希腊掌管月桂的神 浏览 8624 07-20

1300亿!中国啤酒大变局

华商韬略 浏览 510 08-19

美日通电话后欧洲集体变脸 日本对华提出一个新要求

博览历史 浏览 374 11-27

遭指控侵犯专利 "非洲之王"传音控股又被华为告了

每日经济新闻 浏览 8608 08-07

莫斯科空域遭侵袭 多位中国游客滞留

极目新闻 浏览 184 02-24

奥迪“掀桌了”!德味纯电A6L续航815km+华为智驾赋能

有车以后 浏览 87 04-20
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11