SINKT:利用大型语言模型实现结构感知的归纳知识追踪
摘要
本文介绍了一种名为SINKT的新型知识追踪模型,该模型利用大型语言模型(LLM)实现结构感知的归纳知识追踪。知识追踪(KT)是智能辅导系统(ITS)中的关键任务,旨在预测学生对未来问题的回答正确性。传统的基于ID的传导方法在教育KT场景中面临数据稀疏和冷启动问题,且未能直接建模概念与问题之间的复杂关系。SINKT通过引入LLM,首次实现了归纳知识追踪,利用LLM构建概念间的结构关系,并通过编码概念和问题来整合语义信息,最终通过与学生的知识状态和问题表示的交互来预测学生的回答。实验结果表明,SINKT在四个真实世界数据集上优于12种现有的传导KT模型,并展示了在归纳KT任务上的优越性能。
原理
SINKT模型的核心在于利用大型语言模型(LLM)来处理和整合知识追踪任务中的结构和语义信息。首先,SINKT使用LLM构建概念与问题之间的异构图,该图不仅包含数据集中的关系,还整合了LLM提供的开放世界知识。其次,通过预训练语言模型(PLM)对概念和问题的文本进行编码,获取其语义表示。接着,设计了一个结构信息编码器,通过多层异构图注意力网络(GAT)来学习概念和问题的表示,这些表示考虑了图中的多种关系,如概念-问题、概念-概念和问题-概念。最后,通过学生状态编码器捕捉学生的学习历史序列信息,并结合目标问题的表示,通过交互预测器来预测学生的回答。
流程
SINKT的工作流程包括以下几个关键步骤:
- 概念-问题图生成:利用LLM生成包含概念和问题关系的异构图。
 - 文本信息编码:使用PLM对概念和问题的文本进行编码,获取语义表示。
 - 结构信息编码:通过多层GAT网络学习概念和问题的结构表示。
 - 学生状态编码:使用门控循环单元(GRU)捕捉学生的学习历史序列信息。
 - 响应预测:结合学生的知识状态和目标问题的表示,通过交互预测器预测学生的回答。
 
例如,在处理一个新的概念或问题时,SINKT能够自动进行文本编码并通过图传播信息,最终完成响应预测。
应用
SINKT模型不仅在传统的传导知识追踪任务中表现出色,还能有效处理归纳知识追踪任务,即预测新引入概念或问题的学生响应。这使得SINKT在智能辅导系统中具有广泛的应用前景,特别是在需要动态更新和扩展知识库的场景中,如在线教育和个性化学习系统。此外,SINKT的自动化处理流程也使其能够适应不断变化的教育需求和新兴话题,为教育技术的未来发展提供了新的可能性。
