简介：本文综述了深度学习在水下图像降噪与增强领域的应用，探讨了关键技术、模型架构及优化策略，分析了挑战与未来方向，为水下视觉任务提供技术参考。

一、引言

水下视觉任务（如海洋探测、水下考古、生物监测）对图像质量要求极高，但水下环境的光线衰减、散射及噪声干扰导致图像模糊、对比度低、色彩失真。传统方法依赖物理模型或手工特征，难以应对复杂场景。深度学习通过端到端学习，自动提取特征并优化降噪与增强效果，成为该领域的研究热点。本文系统梳理深度学习在水下图像降噪与增强中的应用，分析关键技术、模型架构及优化策略，并探讨挑战与未来方向。

二、水下图像退化原因分析

光线衰减与散射
水体对不同波长光的吸收系数不同（红光衰减最快，蓝光保留较多），导致图像偏蓝绿色。此外，悬浮颗粒（如泥沙、浮游生物）引起前向散射和后向散射，降低对比度并产生“雾状”效果。
噪声来源
水下成像设备（如声呐、光学相机）受传感器热噪声、量子噪声及运动模糊影响，导致图像出现高斯噪声、椒盐噪声或混合噪声。
色彩失真
光线衰减导致RGB通道响应不一致，传统白平衡方法难以恢复真实色彩，需结合深度学习进行色彩校正。

三、深度学习在水下图像降噪中的应用

卷积神经网络（CNN）
CNN通过局部感受野和权重共享提取多尺度特征，适用于空间噪声去除。例如，U-Net架构通过编码器-解码器结构保留空间信息，结合跳跃连接融合浅层与深层特征，提升降噪效果。实验表明，U-Net在合成水下噪声数据集上PSNR提升3-5dB。
生成对抗网络（GAN）
GAN通过生成器与判别器的对抗训练，生成更接近真实无噪图像的样本。CycleGAN无需配对数据，通过循环一致性损失实现跨域转换（如有噪→无噪），适用于真实水下场景。但其训练不稳定，需结合Wasserstein距离或谱归一化改进。
自编码器（AE）
自编码器通过编码-解码结构压缩并重建图像，适用于低信噪比场景。变分自编码器（VAE）引入潜在变量空间，增强生成多样性，但可能损失细节。

四、深度学习在水下 图像增强中的应用

超分辨率重建
基于ESRGAN（增强型超分辨率生成对抗网络）的模型，通过残差密集块（RDB）提取层次化特征，结合对抗损失提升纹理细节。实验显示，在4倍超分辨率任务中，SSIM指标提升0.15。
色彩校正
ColorNet采用双分支结构：一支路估计光照条件，另一支路校正色彩偏差。通过引入语义分割先验（如区分水体与目标区域），提升色彩还原准确性。在真实水下数据集上，ΔE（色彩差异）降低至5以下。
对比度增强
Zero-DCE（零参考深度曲线估计）通过轻量级网络估计光照曲线，无需配对数据即可增强对比度。结合注意力机制（如CBAM），模型可聚焦于低对比度区域，提升局部细节。

五、关键技术挑战与优化策略

数据稀缺问题
真实水下配对数据（有噪/无噪、低质/高清）难以获取。解决方案包括：
- 合成数据生成：基于物理模型（如McGlamery模型）模拟退化过程；
- 无监督学习：利用CycleGAN或对比学习（如SimCLR）挖掘数据内在特征。
模型泛化能力
不同水域（如淡水、海水）的退化模式差异大。可通过以下方式提升泛化性：
- 域适应技术：将源域（合成数据）知识迁移至目标域（真实数据）；
- 元学习：训练模型快速适应新场景。
实时性优化
水下机器人需实时处理图像。可采用模型压缩技术：
- 量化：将FP32权重转为INT8，减少计算量；
- 剪枝：移除冗余通道（如基于L1正则化的通道剪枝）；
- 知识蒸馏：用大模型指导小模型训练。

六、未来研究方向

多模态融合
结合光学图像与声呐数据，利用声呐的穿透性弥补光学成像的局限性。例如，通过Transformer架构融合跨模态特征。
轻量化部署
开发适用于嵌入式设备的模型，如基于MobileNetV3的轻量级架构，或利用硬件加速（如NVIDIA Jetson系列）。
自监督学习
利用水下图像的时空连续性（如视频序列）设计自监督任务（如帧间预测），减少对标注数据的依赖。

七、结论

深度学习为水下图像降噪与增强提供了强大工具，但需解决数据、泛化性与实时性挑战。未来研究应聚焦于多模态融合、轻量化部署及自监督学习，以推动水下视觉技术的实际应用。开发者可参考本文提出的优化策略（如数据合成、模型压缩），结合具体场景选择合适方法。

基于深度学习的水下图像降噪与增强技术综述