admin管理员组

文章数量:1609965

GangSweep: Sweep out Neural Backdoors by GAN

MM’20:Media Interpretation & Mobile Multimedia
论文链接


上接 neural cleanse。neural cleanse通过反向工程构建触发器,从而利用触发器的信息识别和去除后门。但是这种方式只适合于固定的简单的后门触发器,不能够适用于隐形后门、更加复杂的后门触发器。
因此本文提出了GangSweep。为什么不叫GANsweep?

主要贡献

首先:使用生成网络,通过重建目标类周围的流形,来利用神经网络的弱点。并暴露攻击者为后门攻击而插入的所有伪影。

然后:发现目标标签的触发器在特征空间中呈现出有趣的统计特征,它具有较低的移动方差和较大的移动距离。并开发了一系列有效的离群值检测机制,可以明显区分触发器和普通的对抗扰动。

最后:进行了大量的实验。防御不同的触发器,5个数据集,三种最先进的木马攻击。

本文的机制可以检测所有触发器的组合,而neural cleanse只能检测单一、小尺寸和不变的触发器。而在实际中的触发模式ÿ

本文标签: 神经网络后门GANGangSweepBackdoors