论文Forecasting the eddying ocean with a deep neural network要解决的问题是:在全球 1/12° 高分辨率(能清楚看到中尺度涡)的情况下,能不能用一个深度神经网络来做全球海洋短期预报,在精度上不输给、甚至超过最先进的数值海洋模式,同时计算成本更低。中尺度涡是上层海洋动能的核心载体,强烈影响温度、盐度、流场以及海洋热浪等现象,因此能否在 AI 预报中“保住涡”,是这篇论文研究的关键。
论文作者为Yingzhe Cui, Ruohan Wu, Xiang Zhang, Ziqi Zhu, Bo Liu, Jun Shi, Junshi Chen, Hailong Liu, Shenghui Zhou, Liang Su, Zhao Jing, Hong An 和 Lixin Wu,来自Frontiers Science Center for Deep Ocean Multispheres and Earth System and Key Laboratory of Ocean dynamics/Academy of Future Ocean, Ocean University of China, Qingdao, China. Department of Ocean Big Data and Prediction, Laoshan Laboratory(崂山实验室), Qingdao, China. School of Computer Science and Technology, University of Science and Technology of China, Hefei, China. Joint Laboratory of Advanced Computing for Transparent Oceans between Laoshan Laboratory and University of Science and Technology of China, Hefei, China. Qingdao Guoshi Technology Group Co., Ltd, Qingdao, China.
一、方法与模型 WenHai(问海)
作者提出了一个名为 WenHai 的 AI 全球海洋预报系统,核心思路有几个要点:
- 预报对象:
- 空间:全球 1/12°,0–643 m 上层海洋多层三维温度、盐度、水平流速,以及海表高度。
- 时间:日平均场,自回归逐日推演,可做到 10 天预报。
- 输入输出设计:
- 输入包含当天的海洋三维状态和空气–海洋通量(动量、热量、淡水通量)。
- 输出不是“下一天的状态”,而是“倾向”(一天之内的增量),再累加得到下一天状态,更贴合物理演化方程,也更突出中尺度变化。
- 物理先验:
- 空气–海洋通量并不是直接让网络去学,而是先用 bulk formula(经验公式)把大气再分析和海表信息转成真实的通量再喂给网络,等于把边界层物理“硬编码”到系统里。
- 网络结构:
- 主干使用 Swin-Transformer(局地窗口自注意力),配合卷积下采样/上采样,在有限显存下处理全球高分辨率网格。
- 在损失函数中对上层海水(中尺度涡活跃区)赋更高权重,对盐度等弱信号变量单独放大权重,同时对陆地区域进行掩膜处理。
- 训练策略:
- 第一步先训练单日倾向预测。
- 第二步采用多日自回归微调(一次前向滚动 5 天),直接优化多步滚动预报的整体误差,减缓长时效漂移。
二、主要结果与对比结论
- 与数值 GOFS(GLO12v4)的对比:
- 使用相同初始场和相同 ECMWF 大气强迫,在 Argo 剖面、漂流浮标和卫星高度计等观测上做严格对比。
- 在所有变量(温度、盐度剖面,SST、海表高度、15 m 流速)上,WenHai 的误差(RMSE)普遍小于数值模式,且随预报时效增加优势更明显。
- 相对“持久性预报”的技能评分 PSS 显示:数值模式在不少变量上甚至不如持久性,而 WenHai 在几乎所有变量上都优于持久性预报。
- 使用邻域概率指标 CRPS(避免单点误差双重惩罚)评价时,WenHai 在全部变量、全部预报时效上 CRPS 都低于数值模式。
- 与最新 AI 海洋模型 XiHe 的对比:
- 通过计算涡动能(EKE)以及温度、盐度涡方差发现:XiHe 明显“抹平了涡”,中尺度方差显著低于再分析。
- WenHai 的涡动能和涡方差与再分析接近得多,说明明显更能保持中尺度涡的强度和细节。
- 在 CRPS 指标上,WenHai 对所有变量、所有预报时效都优于 XiHe,尤其在 SST 上改善幅度达到二三成。
三、意义、局限与展望
- 意义:
- 证明了在海洋这种观测稀疏、过程复杂的系统中,经过“物理知识引导”的深度网络,已经有能力在短期预报上整体超过成熟的高分辨率数值海洋模式。
- 由于计算成本远低于传统数值模式,这类 AI GOFS 为高频更新、集合预报以及嵌套更高分辨率区域模式提供了现实可能。
- 论文在任务设计、损失构造和评估指标上,提供了一套针对高分辨率、中尺度涡预报的“工程化最佳实践”。
- 局限:
- 目前只做日平均预报,无法解析昼夜循环、惯性振荡和内波等高频过程。
- 垂向只到 643 m,未显式模拟深层过程及其对上层的反馈。
- 尚未纳入河流入海、海冰等关键过程,在沿岸和极地表现可能有限。
- 仍存在一定程度的涡方差衰减,高分辨率场依然有被“略微抹平”的趋势。
- 展望:
- 未来可引入多尺度分层网络、概率预报与物理守恒约束,或者与数值模型形成混合系统。
- 进一步提高时间分辨率,引入更多物理过程,并探索端到端观测–同化–预报一体化的 AI 海洋系统。