"革新对话代理:基于大型语言模型的计划型对话系统"

Planning with Large Language Models for Conversational Agents

摘要

本文介绍了一种基于大型语言模型(LLM)的计划型对话代理(PCA)框架,旨在提高对话代理的控制性和主动性。传统的对话系统在控制性和主动性方面存在局限,而PCA框架通过离线规划标准操作程序(SOP)和在线规划最佳行动路径,实现了对话过程的控制性和主动性。此外,论文还提出了一种半自动对话数据创建框架,并开发了多个PCA变体和评估指标,实验结果显示PCA在对话控制性、主动性、任务成功率和逻辑一致性方面表现优异。

原理

PCA框架的核心在于利用LLM进行对话规划,具体包括离线规划和在线规划两个阶段。离线规划阶段,LLM根据人类定义的任务和目标,规划出对话的核心和必要的SOP。在线规划阶段,LLM根据SOP规划最佳行动路径,并生成响应以实现对话过程的控制性。此外,PCA框架还引入了蒙特卡洛树搜索(MCTS)算法,通过在扩展和模拟步骤中编码SOP约束,搜索最优对话行动,从而增强对话的主动性。

流程

PCA的工作流程分为四个主要步骤:定义任务、规划任务SOP、创建对话场景和生成实际对话。首先,定义任务包括用户配置的任务信息和SOP顶点。其次,LLM作为规划者,根据定义的任务规划SOP。然后,LLM作为编剧,根据手动修正的SOP采样对话路径,并插入额外的代理行动和用户状态,创建个性化的对话场景。最后,LLM作为剧本作者,为对话路径中的每个代理行动和用户状态编写对话,生成完整的对话。

应用

PCA框架的应用前景广泛,特别适用于需要高度控制性和主动性的工业对话场景,如客户服务、销售和教育培训等。通过提高对话代理的控制性和主动性,PCA能够更有效地引导对话,提高任务完成率和用户满意度。此外,PCA框架的低手动干预特性也使其在快速部署和扩展方面具有优势。