Chain & Hash:保护大型语言模型的创新指纹技术
摘要
本文介绍了一种名为Chain & Hash的新型指纹技术,旨在解决大型语言模型(LLMs)的盗窃和滥用问题。该技术通过在模型中嵌入独特的指纹,使模型所有者能够验证其模型是否被未经授权使用或完全被盗。Chain & Hash通过生成一系列问题和可能的答案,并使用安全哈希技术将它们链接起来,从而确保指纹的不可伪造性。该技术在多个模型上进行了评估,展示了其对抗良性变换和恶意尝试擦除指纹的鲁棒性。此外,Chain & Hash在保持模型性能的同时,实现了高效的指纹嵌入和验证。
原理
Chain & Hash的工作原理基于生成一组问题(指纹)和一组可能的答案,然后使用安全哈希技术(如SHA-256)将这些元素结合起来,选择每个问题的答案。通过这种方式,Chain & Hash确保了指纹的不可伪造性,因为任何试图伪造指纹的尝试都会改变哈希值,从而改变预期的答案。此外,该技术还考虑了对抗性条件,如模型在不同数据集上的微调,以及对抗性尝试通过过滤或输出操纵来绕过指纹。
流程
Chain & Hash的工作流程包括以下步骤:
- 生成一组问题(Q)和256个可能的答案(T)。
 - 使用安全哈希技术将每个问题与所有问题和可能的答案连接起来,计算哈希值。
 - 使用哈希值的最后一个字节作为索引,从可能的答案中选择每个问题的答案。
 - 使用这些问题和答案对目标模型进行微调,以嵌入指纹。
 - 验证时,重复上述过程,查询模型并检查生成的答案是否与预期的指纹答案匹配。
 
例如,对于一个包含四个问题的链,每个问题与所有问题和可能的答案一起哈希,然后使用哈希值的最后一个字节选择答案。验证时,只需查询两个问题即可通过加密方式证明所有权。
应用
Chain & Hash技术适用于所有大型语言模型,特别是在模型所有者需要证明其模型所有权和防止模型被盗用的场景中。该技术的高效性和鲁棒性使其在保护知识产权和确保模型安全方面具有广泛的应用前景。随着LLMs在各个领域的广泛应用,Chain & Hash将成为保护这些模型不被滥用的重要工具。
