近日,南方海洋科学与工程广东省实验室(珠海)(以下简称实验室)前沿研究中心模式开发组以“Performance Comparison of Multi-Task and Single-Task Learning in Ocean Color Retrieval: A Case Study of Hong Kong Coastal Waters”为题,在地球科学与遥感领域国际顶级期刊IEEE Transactions on Geoscience and Remote Sensing发表了多任务学习协同反演香港近岸海域叶绿素a、悬浮物浓度和水体透明度等海洋水色参数的研究成果。
海洋水色实景展示
海洋水色参数是评估近岸水质的关键指标,传统遥感反演算法往往针对单一要素独立构建,忽略了各要素间内在的物理关联。本研究以从VIIRS/SNPP遥感影像中联合反演香港近岸海域叶绿素a浓度、悬浮物浓度和透明度为例,从模型的网络架构、噪声敏感性、泛化能力和反演结果的精度、时空分布格局等多维度进行对比,系统分析了基于人工神经网络的多任务学习与单任务学习模型的表现差异。
结果表明,多任务学习模型在叶绿素a浓度和透明度的反演上显著优于单任务学习模型(图1),并在悬浮物浓度的反演上取得了相当的性能。多任务学习模型在输入噪声的鲁棒性以及对离岸站点的泛化能力方面,对于叶绿素a浓度和透明度均表现出更强的优势(图2),悬浮物浓度可作为辅助任务改善其他两个参数的反演精度。进一步分析表明,多任务学习编码了透明度与叶绿素a浓度、悬浮物浓度之间的负相关关系,并通过特征共享与隐式正则化机制,抑制数据稀缺场景下的过拟合现象。本研究不仅验证了多任务学习在海洋水色遥感中的适用性,而且揭示了多任务学习优势的潜在机制,为数据稀缺场景下物理一致的智能反演提供了一种有效且轻量级的策略。
图1. 2012年1月1日至2022年12月31日期间春季(a、e、i)、夏季(b、f、j)、秋季(c、g、k)及冬季(d、h、l)的季节平均透明度。(a-d)现场测量(空间线性插值),(e-h)单任务学习(STL)模型反演结果,(i-l)多任务学习(MTL)模型反演结果。多任务学习模型结果与现场测量的分布格局一致,而单任务学习模型结果明显高估了大鹏湾及其附近海域的透明度,尤其是在春季。
图2. 基于平均绝对百分比误差的多任务学习(MTL)与单任务学习(STL)模型泛化性能对比。(a)叶绿素a浓度、(b)悬浮物浓度和(c)透明度在训练集(Training set)、验证集(Validation set)和离岸测试集(Testing set)上的误差表现。对比测试集相对于训练集的误差增量,发现多任务学习明显低于单任务学习,表现出更强的泛化能力。
该论文的第一作者为实验室前沿研究中心模式开发组马春雷副研究员与中山大学张光博士后,通讯作者为实验室前沿研究中心模式开发组首席研究员朱学明与中山大学艾彬教授,合作者还包括中山大学赵俊教授、博士生何文博以及硕士生彭洲。
该研究得到了国家自然科学基金、广东省基础与应用基础研究基金、南方海洋实验室自主科研项目以及海洋负排放国际大科学计划等的支持。
原文链接:https://ieeexplore.ieee.org/document/11442780


