ResVMUNetX:基于VMamba架构的低光图像增强网络,实现高效实时图像处理

RESVMUNetX: A Low-Light Enhancement Network Based on VMamba

摘要

本文介绍了一种基于VMamba架构的低光图像增强网络——ResVMUNetX。该研究针对现有深度学习方法在捕捉图像长距离信息方面的不足,提出了一种基于误差回归的方法,通过直接增加估计的照明补充来增强输入图像的亮度和恢复结构细节。ResVMUNetX通过高效的VMamba架构优化了长距离信息的捕捉,并结合CNN模块进行局部细节提取和噪声去除,显著提高了低光图像的清晰度和视觉质量,同时大幅减少了参数和计算负载,实现了高达70帧每秒的处理速度。实验结果表明,ResVMUNetX在图像质量和性能上均超越了现有的图像增强方法,尤其在实时处理能力方面展现出巨大潜力。

原理

ResVMUNetX的核心工作原理是基于误差回归的图像增强方法。该网络采用VMUNetX作为特征提取的主干,通过改进的VMUNet进行特征提取,并对低光输入进行误差估计,通过直接在输入像素上增加像素来实现初步增强。随后,使用基于CNN的专用Denoise CNN模块对低光输入进行局部细节提取和噪声去除。这种方法通过优化状态空间模型,有效地增强了低光图像的清晰度和视觉质量,同时显著提高了算法的计算速度。

流程

ResVMUNetX的工作流程分为两个主要阶段。第一阶段,利用基于VMamba架构的VMUNetX核心特征提取网络,深入学习图像的全局特征,并准确估计低光输入与参考目标之间的误差成分。通过在原始低光输入的像素级别上叠加估计的误差成分,补偿低光输入与目标参考之间的失真,实现初步的图像增强效果。第二阶段,考虑到原始低光输入中存在的大量噪声,冻结VMUNetX部分,引入专门设计的DenoiseCNN进行低光输入的降噪处理。将DenoiseCNN处理的输入与VMUNetX部分输出的误差成分在像素级别上相加,实现最终的图像增强。

应用

ResVMUNetX在低光图像增强领域展现出显著的应用前景。其高效的图像处理能力和实时性能使其适用于需要快速图像处理的场景,如监控系统、自动驾驶辅助系统等。此外,该技术的低参数和计算负载特性也使其适合部署在资源受限的边缘设备上,如智能手机和嵌入式系统,进一步扩展了其应用范围。