LETS-C:利用语言嵌入实现高效时间序列分类的新方法
摘要
本文介绍了一种名为LETS-C的新型时间序列分类方法,该方法利用语言嵌入模型来处理时间序列数据。传统的基于大型语言模型(LLM)的方法由于模型规模庞大,训练参数数量众多,导致计算成本高昂。LETS-C通过使用语言嵌入模型将时间序列数据嵌入到向量空间中,并结合卷积神经网络(CNN)和多层感知器(MLP)进行分类,显著减少了训练参数的数量,同时保持了高分类准确性。实验结果表明,LETS-C在多个标准时间序列分类基准数据集上达到了最先进的性能,且模型更为轻量级,适用于资源受限的环境。
原理
LETS-C方法的核心在于利用预训练的语言嵌入模型将时间序列数据转换为高维向量表示。这些嵌入向量随后与原始时间序列数据结合,通过一个由CNN和MLP组成的简单分类头进行分类。具体来说,时间序列数据首先经过预处理,标准化为[0, 1]范围。然后,这些标准化的时间序列数据被转换为字符串格式,并通过语言嵌入模型生成嵌入向量。为了确保数值的完整性和提高模式识别的准确性,采用了数字空间标记化策略。生成的嵌入向量与时间序列数据进行元素级加法融合,最后通过轻量级的CNN和MLP结构进行分类。这种方法不仅减少了模型的复杂性,还提高了处理速度和效率。
流程
- 预处理:将时间序列数据标准化为[0, 1]范围。
 - 文本嵌入生成:将标准化的时间序列数据转换为字符串格式,并通过语言嵌入模型生成嵌入向量。
 - 数据融合:将生成的嵌入向量与原始时间序列数据进行元素级加法融合。
 - 分类:通过由CNN和MLP组成的分类头对融合后的数据进行分类。
 
应用
LETS-C方法在时间序列分类领域具有广泛的应用前景,特别是在金融、医疗保健和活动识别等领域。由于其轻量级和高效率的特点,LETS-C特别适合于资源受限的环境,如移动设备或嵌入式系统。此外,该方法的灵活性和可扩展性也使其能够适应不断变化的数据环境和应用需求。
