探索海洋与大气科学的新工具:基于对比自监督学习的WV-Net模型

WV-Net: A foundation model for SAR WV-mode satellite imagery trained using contrastive self-supervised learning on 10 million images

摘要

本文介绍了一种基于对比自监督学习的方法,用于训练WV模式卫星图像的基础模型WV-Net。该研究利用近1000万张WV模式图像,通过对比自监督学习训练了一个语义嵌入模型WV-Net。在多个下游任务中,WV-Net的表现优于通过监督学习预训练的自然图像模型(如ImageNet)。实验结果显示,在估计波浪高度、近表面空气温度以及多标签分类等任务中,WV-Net的性能均有显著提升。此外,WV-Net在无监督图像检索任务中也表现出优越性能,并且在数据稀疏环境中具有更好的扩展性。这些结果表明,WV-Net嵌入可以支持地球物理研究,为各种数据分析和探索任务提供了一个方便的基础模型。

原理

WV-Net基于SimCLR对比自监督学习框架,使用ResNet50作为后端架构。SimCLR框架通过学习两个增强视图的相似表示,同时抑制与其他图像表示的相似性来训练模型。具体来说,训练步骤开始时,随机选择一批训练图像,每个图像通过随机序列的增强策略(从一组变换中采样)生成两个视图,然后通过ResNet50和一个小型的投影神经网络进行编码,生成嵌入向量。损失函数通过计算正样本对嵌入向量之间的相似度来定义,从而鼓励模型学习到图像的内在特征表示。

流程

WV-Net的工作流程包括数据预处理、模型训练和评估三个主要阶段。首先,对S-1卫星的WV模式图像进行预处理,包括归一化、降采样和强度归一化。然后,使用SimCLR框架和优化后的数据增强策略对WV-Net进行训练。最后,通过多标签分类、回归任务和图像检索任务对模型进行评估。例如,在多标签分类任务中,模型需要识别图像中存在的多种地球物理现象,如风条纹、微尺度对流细胞等。

应用

WV-Net的应用前景广泛,包括研究空气-海洋相互作用、改进数值天气预测的约束条件以及监测海冰等。由于WV-Net在数据稀疏环境中的优越性能,它特别适合于那些数据量有限但需要高精度分析的地球物理研究领域。此外,WV-Net的嵌入能力还可以用于图像检索和数据挖掘,为海洋和大气科学研究提供新的分析工具。