IncogniText：利用LLM实现先进的文本匿名化技术，保护您的隐私安全

Posted on 2024-07-03 in CS.AI • 8 words • 1 minute read

Last updated on 2024-07-05

摘要

本文介绍了一种名为IncogniText的新型文本匿名化技术，旨在防止潜在的攻击者正确推断文本作者的私人属性，同时保持文本的实用性和语义。IncogniText利用基于大型语言模型（LLM）的私有属性随机化方法，通过误导攻击者预测错误的私人属性值来实现文本匿名化。实验评估显示，IncogniText能有效减少私人属性泄露，降低攻击者推断准确率超过90%，并已成熟应用于实际场景，通过将匿名化能力提炼成一组LoRA参数，与设备上的模型相结合。

原理

IncogniText的工作原理是利用一个匿名化模型Manon，通过重新编写原始文本xorig，使用目标属性值atarget、真实属性值atrue和匿名化模板Tanon，生成匿名化文本xanon。目标属性值可以由用户选择或从预定义的属性值集合中随机抽取。此外，Manon还被告知真实属性值atrue，以生成特别定制的匿名化文本，旨在隐藏该真实属性值。为了验证匿名化文本xanon对抗属性推断的有效性，使用一个模拟的敌对模型Madv进行测试，如果预测正确，则进行额外的匿名化迭代，直到敌对模型被误导或达到最大迭代次数。这种方法确保了尽可能少的文本重写迭代，从而最大限度地保持文本的实用性。

流程

IncogniText的工作流程包括以下步骤：首先，用户或系统选择一个目标属性值atarget，并提供原始文本xorig和真实属性值atrue。然后，匿名化模型Manon使用这些输入和匿名化模板Tanon生成匿名化文本xanon。接下来，使用敌对模型Madv对匿名化文本进行属性推断测试。如果推断结果正确，则重复匿名化过程，直到推断结果错误或达到预设的迭代次数。例如，如果原始文本中作者的真实收入水平为“中收入”，IncogniText可能会将其替换为“低收入”，同时保持文本的其他部分不变，从而误导敌对模型。

应用

IncogniText的应用前景广泛，特别是在需要保护用户隐私的领域，如在线服务（如ChatGPT）和匿名社交媒体平台（如Reddit）。此外，IncogniText的技术成熟度使其能够集成到消费产品中的小型设备模型上，进一步扩展其应用范围。随着数据隐私法规的日益严格，IncogniText有望成为保护个人数据隐私的重要工具。