细粒度自一致性：提升大型语言模型生成质量的新方法

Posted on 2024-07-02 in CS.AI • 16 words • 1 minute read

Last updated on 2024-07-05

摘要

本文介绍了一种名为“细粒度自一致性（Fine-Grained Self-Consistency, FSC）”的新方法，旨在通过从多个候选样本中提取和整合段落级别的共同知识，来提高大型语言模型（LLMs）在开放式生成和推理任务中的性能。FSC通过两种策略——候选过滤和合并，进一步提高了性能并降低了成本。实验结果显示，FSC在多种任务中显著优于基线方法，展示了其优化输出质量的潜力。

原理

FSC的工作原理基于从多个候选样本中提取段落级别的共同元素，并利用LLMs的文本理解和对比能力来合成这些元素，从而生成优化输出。具体来说，FSC首先测量每个段落的共同性，然后提取相应的共同部分，最后融合这些共同部分以生成最终输出。这种方法通过细粒度的分析和整合，克服了传统基于选择或投票机制的自一致性方法的局限性。

流程

FSC的工作流程包括以下步骤：

生成多个候选样本。
使用LLMs的文本理解和对比能力，提取每个段落的共同元素。
合成这些共同元素以生成优化输出。
通过候选过滤策略，使用自动化指标识别高相似度的候选集，以提高整体质量。
通过合并策略，合并高度相似的样本，以减少输入令牌的需求。例如，在代码生成任务中，FSC能够从多个错误的候选样本中提取正确的部分，最终生成正确的代码解决方案。

应用

FSC的应用前景广泛，适用于需要高质量输出的多种任务，包括文本摘要、代码生成和数学推理等。由于其能够有效整合多个样本的细粒度共识知识，FSC有望在未来的自然语言处理和人工智能领域发挥重要作用，特别是在需要复杂推理和创造性输出的场景中。