探索RICHES：一种革命性的检索与生成交错方法

Posted on 2024-06-29 in CS.AI • 16 words • 1 minute read

Last updated on 2024-07-05

摘要

本文介绍了一种名为RICHES的新型方法，该方法在序列生成任务中与检索操作交错进行。与传统的RAG系统不同，RICHES通过直接解码文档内容并受限于语料库，消除了对独立检索器和生成器的需求。这种方法通过单一的LLM解码过程，实现了检索与生成的统一，使得系统能够通过简单的提示适应多样的新任务。RICHES在开放域问答（ODQA）任务中表现出色，支持多跳检索和交错思维，以规划下一步检索内容。

原理

RICHES的核心在于将检索与序列生成任务无缝集成。它通过直接解码文档内容或相关的自然语言检索键来检索文档，这些键指向生成它们的文档。这种方法的关键在于利用LLM的解码过程作为搜索过程，通过约束解码空间来确保生成的序列存在于感兴趣的语料库中。通过这种方式，RICHES能够在单一的解码过程中实现多跳检索和交错思维，从而有效地规划和执行检索任务。

流程

RICHES的工作流程包括以下几个步骤：

输入查询：用户输入一个查询或问题。
生成检索键：LLM生成与查询相关的检索键。
检索文档：通过解码检索键，LLM从语料库中检索相关文档。
生成答案：LLM根据检索到的文档生成答案，并在生成过程中交错思维以指导下一步的检索。
输出答案：最终生成的答案被返回给用户。

例如，对于一个多跳问题“谁在1992-93赛季为夏洛特黄蜂队效力并在WNBA夏洛特蜂刺队担任主教练？”，RICHES会首先生成关键词“1992-93赛季夏洛特黄蜂队成员”，然后检索相关文档，接着生成关键词“Muggsy Bogues的特殊身份”，并检索相关文档，最终生成答案“Muggsy Bogues是NBA历史上最矮的球员”。

应用

RICHES的应用前景广泛，特别适用于需要复杂推理和多跳检索的开放域问答系统。由于其能够通过简单的提示适应新任务，RICHES在教育、客户服务、信息检索等领域具有巨大的潜力。此外，随着LLM的不断发展，RICHES的性能和适应性有望进一步提升，使其成为未来智能问答系统的核心组件。