零样本识别:大型语言模型在智能家居活动识别中的革命性应用

Large Language Models are Zero-Shot Recognizers for Activities of Daily Living

摘要

本文介绍了一种基于大型语言模型(LLM)的零样本日常活动识别系统ADL-LLM。该系统通过将传感器数据转换为文本表示,利用LLM进行零样本识别,无需大量标注数据。此外,当有少量标注数据可用时,ADL-LLM还能通过少样本提示机制进一步提高识别准确率。研究在两个公开数据集上验证了ADL-LLM的有效性,展示了其在日常活动识别领域的应用前景。

原理

ADL-LLM的核心工作原理是将原始传感器数据转换为自然语言描述,然后利用预训练的大型语言模型(LLM)进行活动识别。具体步骤包括:

  1. 传感器数据转换:将传感器数据转换为描述性的文本形式,例如“电视在客厅从12:34到13:02是开启的”。
  2. LLM处理:LLM接收这些文本描述,并利用其内置的常识知识来推断最可能的日常活动。
  3. 零样本识别:LLM能够在没有特定活动训练数据的情况下进行识别,这得益于其广泛的知识库和强大的推理能力。
  4. 少样本提示:当有少量标注数据可用时,ADL-LLM可以通过选择与当前窗口语义相似的样本来增强系统提示,从而提高识别准确率。

流程

ADL-LLM的工作流程如下:

  1. 传感器状态生成:从智能家居环境中收集传感器数据,并生成传感器状态的连续流。
  2. 分段:将传感器状态流分割成固定时间窗口,每个窗口包含一定时间内的传感器状态。
  3. 窗口到文本转换:将每个时间窗口的传感器状态转换为自然语言描述。
  4. 系统提示和用户提示构建:构建系统提示(定义任务)和用户提示(包含当前窗口的文本描述和额外指令)。
  5. LLM识别和活动标签提取:LLM处理输入提示并生成活动识别结果,然后提取最可能的活动标签。
  6. 少样本提示机制:如果有少量标注数据,通过语义选择机制选择相似样本,增强系统提示以提高识别准确率。

应用

ADL-LLM在智能家居环境中具有广泛的应用前景,特别是在能源管理、安全监控、健康护理等领域。其零样本识别能力使其能够快速部署在新的环境中,无需大量标注数据,适用于快速变化和多样化的应用场景。此外,随着技术的进一步发展,ADL-LLM有望在更多领域实现个性化和精细化的活动识别。