探索抽象推理的新前沿:ARLC模型的创新与应用

Towards Learning Abductive Reasoning using VSA Distributed Representations

摘要

本文介绍了一种名为Abductive Rule Learner with Context-awareness (ARLC)的模型,该模型基于Learn-VRF,专门用于解决基于抽象推理的任务,特别是在Raven’s progressive matrices (RPM)测试中的应用。ARLC通过引入一种新颖且更广泛适用的训练目标,显著提高了抽象推理任务的可解释性和准确性。该模型不仅能够编程领域知识,还能学习数据分布背后的规则。在I-RAVEN数据集上的评估显示,ARLC在分布内和分布外(未见过的属性-规则对)测试中均达到了最先进的准确率,超越了包括大型语言模型在内的神经符号和连接主义基线,尽管其参数数量远少于这些基线。此外,ARLC在编程后训练中表现出鲁棒性,能够从示例中逐步学习,而不会导致编程解决方案的灾难性遗忘。本文还验证了ARLC从2x2 RPM星座无缝转移到未见过的星座的能力。

原理

ARLC模型的核心在于其创新的上下文感知优化问题公式和更表达性的规则模板。这些改进允许在执行和选择步骤中共享具有相同参数的规则,从而提高了解释性。ARLC通过向量符号架构(VSA)进行分布式表示,利用高维向量空间中的数学属性来处理和表示数据。模型通过学习RPM规则的软分配,将视觉属性向量映射到固定的规则模板中,从而在推理过程中生成答案面板。ARLC的关键创新包括上下文增强的优化问题公式和更复杂的规则模板,这些改进不仅提高了模型的表达能力,还增强了其在处理复杂RPM问题时的性能。

流程

ARLC的工作流程包括两个主要步骤:规则执行和规则选择。在规则执行步骤中,模型并行应用所有学习到的规则到输入数据上。在规则选择步骤中,模型根据规则的置信度值生成对缺失面板的预测。具体来说,模型首先将视觉属性转换为VSA高维空间中的向量,然后通过学习到的规则模板进行推理,最终通过软选择机制确定最可能的答案。例如,在处理I-RAVEN数据集中的RPM测试时,ARLC能够识别并应用适当的规则来解决包含多个对象的复杂问题。

应用

ARLC模型的应用前景广泛,特别是在需要抽象推理和解决复杂问题的领域,如教育评估、人工智能辅助决策和高级认知任务的自动化。由于其高准确性和对未见数据的良好泛化能力,ARLC有望在各种实际应用中发挥重要作用,特别是在需要处理和理解复杂视觉和逻辑关系的场景中。