IncogniText:利用LLM实现先进的文本匿名化技术,保护您的隐私安全

IncogniText: Privacy-enhancing Conditional Text Anonymization via LLM-based Private Attribute Randomization

摘要

本文介绍了一种名为IncogniText的新型文本匿名化技术,旨在防止潜在的攻击者正确推断文本作者的私人属性,同时保持文本的实用性和语义。IncogniText利用基于大型语言模型(LLM)的私有属性随机化方法,通过误导攻击者预测错误的私人属性值来实现文本匿名化。实验评估显示,IncogniText能有效减少私人属性泄露,降低攻击者推断准确率超过90%,并已成熟应用于实际场景,通过将匿名化能力提炼成一组LoRA参数,与设备上的模型相结合。

原理

IncogniText的工作原理是利用一个匿名化模型Manon,通过重新编写原始文本xorig,使用目标属性值atarget、真实属性值atrue和匿名化模板Tanon,生成匿名化文本xanon。目标属性值可以由用户选择或从预定义的属性值集合中随机抽取。此外,Manon还被告知真实属性值atrue,以生成特别定制的匿名化文本,旨在隐藏该真实属性值。为了验证匿名化文本xanon对抗属性推断的有效性,使用一个模拟的敌对模型Madv进行测试,如果预测正确,则进行额外的匿名化迭代,直到敌对模型被误导或达到最大迭代次数。这种方法确保了尽可能少的文本重写迭代,从而最大限度地保持文本的实用性。

流程

IncogniText的工作流程包括以下步骤:首先,用户或系统选择一个目标属性值atarget,并提供原始文本xorig和真实属性值atrue。然后,匿名化模型Manon使用这些输入和匿名化模板Tanon生成匿名化文本xanon。接下来,使用敌对模型Madv对匿名化文本进行属性推断测试。如果推断结果正确,则重复匿名化过程,直到推断结果错误或达到预设的迭代次数。例如,如果原始文本中作者的真实收入水平为“中收入”,IncogniText可能会将其替换为“低收入”,同时保持文本的其他部分不变,从而误导敌对模型。

应用

IncogniText的应用前景广泛,特别是在需要保护用户隐私的领域,如在线服务(如ChatGPT)和匿名社交媒体平台(如Reddit)。此外,IncogniText的技术成熟度使其能够集成到消费产品中的小型设备模型上,进一步扩展其应用范围。随着数据隐私法规的日益严格,IncogniText有望成为保护个人数据隐私的重要工具。