融合CNNs和ViTs的人类动作识别新模型

Posted on 2024-06-02 in CS.AI • 15 words • 1 minute read

Last updated on 2024-07-10

摘要

本文是一篇关于人类动作识别（HAR）的综述，主要介绍了卷积神经网络（CNNs）、循环神经网络（RNNs）和视觉转换器（ViTs）在该领域的应用和发展。文章还提出了一种新的混合模型，将CNNs和ViTs的优势相结合，以提高HAR系统的性能。

本文的关键内容是提出了一种新的混合模型，将CNNs和ViTs的优势相结合，以提高HAR系统的性能。该模型的工作原理如下：

该模型的工作流程如下：

该模型的应用前景非常广泛，可以应用于医疗、教育、娱乐、视觉监控、视频检索等领域，帮助人们更好地理解和分析人类动作。