"QUEEN:一种新型防御机制,有效保护深度学习模型免受提取攻击"
摘要
本文介绍了一种名为QUEEN的新型防御机制,旨在对抗模型提取攻击(MEA),这种攻击威胁到深度学习模型的安全性和隐私。QUEEN通过测量查询的敏感性并主动对潜在的模型提取攻击进行反击,从而限制了攻击者训练盗版模型的能力。该方法通过敏感性测量和输出扰动两个主要组件,有效地防止了攻击者通过查询结果训练出性能接近原始模型的盗版模型。实验结果显示,QUEEN在对抗多种模型提取攻击时表现优于现有防御措施,且对模型准确性的影响相对较低。
Read more...








