强化学习驱动:对话代理如何通过图表示主动扩展知识库

Knowledge acquisition for dialogue agents using reinforcement learning on graph representations

摘要

本文介绍了一种利用强化学习在图表示上进行知识获取的对话代理。该代理旨在通过与其他代理的对话,战略性地获取新信息,扩展其知识库。代理将其知识建模为RDF知识图,并通过对话整合新信念。对话中的响应是通过识别围绕这些新整合信念的图模式生成的。研究表明,可以通过强化学习学习策略,在交互过程中选择有效的图模式,而无需依赖显式的用户反馈。本文证明了利用用户作为有效信息源的概念验证,展示了知识中心代理通过对话主动获取知识的潜力。

原理

本文提出的代理基于Belief-Desire-Intention (BDI)模型,代理具有信息意图。这些意图通过符号知识库进行建模,特别是使用图和RDF技术来表示代理已有的或目标知识。代理通过评估其知识状态,设定知识需求,识别知识缺失,并通过与用户的交互主动获取缺失知识。强化学习用于学习对话策略,选择在特定情境下改善知识状态的选项,而不需要显式的人类反馈。

流程

代理的工作流程包括五个主要步骤:语言理解、信念整合、欲望生成、欲望选择和语言生成。在对话过程中,代理将用户的输入信号(如音频、文本)解释为交互知识图(iKG),并将其与现有的情节知识图(eKG)合并。然后,代理评估合并后的信念,生成一系列焦点区域以潜在改进,并选择特定的信念进行改变,通过生成适当的响应信号(如音频、文本)来引发用户的进一步输入。

应用

本文提出的知识中心对话代理具有广泛的应用前景,包括客户服务、个人伴侣、在线 moderator 和新闻推荐系统等。代理能够适应各种任务和领域,通过扩展其知识库,提高其适应性和响应性。此外,该代理框架的鲁棒性使其能够处理不同质量的知识源,增强了其在实际应用中的可行性。