提升神经符号知识图谱补全性能的三种简单规则增强技术

Simple Augmentations of Logical Rules for Neuro-Symbolic Knowledge Graph Completion

摘要

本文介绍了一种针对神经符号知识图谱补全(NS-KGC)模型的高质量规则集增强方法。由于现有的神经模型在维持高覆盖率方面存在困难,本文提出了三种简单的规则集增强技术:(1)将规则转换为其溯因形式,(2)生成使用构成关系逆形式的等效规则,(3)通过随机游走提出新规则,并最终修剪可能低质量的规则。实验结果表明,这些增强技术在四个数据集和五种规则集基准设置上持续提高了性能,相较于未增强的规则,MRR和Hits@1分别提高了7.1点和8.5点。

原理

本文提出的规则增强技术主要通过以下三种方法提高规则集的质量和覆盖率:

  1. 溯因推理:将每个演绎规则转换为其溯因对应形式,从而增加规则的多样性和覆盖范围。
  2. 规则逆形式:通过使用所有构成关系的逆形式来补充每个规则,增加规则的灵活性和适用性。
  3. 随机游走增强:通过在知识图谱上的局部随机游走生成新的高质量规则,并通过PCA过滤来保证规则的质量。 这些增强技术不仅增加了规则集的大小,还通过过滤低质量规则来平衡运行时间,确保了规则集的高质量和高效性。

流程

  1. 规则转换:首先,对现有的规则集进行溯因转换,生成新的溯因规则。
  2. 规则逆形式补充:接着,对转换后的规则集进行逆形式补充,生成等效的逆形式规则。
  3. 随机游走生成新规则:然后,通过在知识图谱上的随机游走生成新的规则,并通过PCA分数进行过滤,保留高质量规则。
  4. 规则修剪:最后,对增强后的规则集进行修剪,去除低质量规则,确保规则集的高质量和高效性。 例如,对于一个规则“BornIn(X, U) ∧ PlaceInCountry(U, Y) ⇒ Nationality(X, Y)”,通过溯因推理可以生成新的规则,如“PlaceInCountry(U, Y) ∧ Nationality(X, Y) ⇒ BornIn(X, U)”。

应用

这些规则增强技术可以广泛应用于各种神经符号知识图谱补全模型,提高模型的推理能力和性能。特别是在处理大规模知识图谱时,这些技术能够显著提升模型的覆盖率和准确性,为知识图谱的自动补全和推理提供强有力的支持。