(NeurIPS25) FuXi-Ocean: A Global Ocean Forecasting System withSub-Daily Resolution
本文提出FuXi-Ocean,首个数据驱动的全球海洋预报模型,实现了6小时时间分辨率、1/12°空间分辨率和0-1500m深度覆盖。针对海洋变量的多尺度时间动态特性,模型创新性地设计了自适应多尺度时间建模架构和Mixture-of-Time模块,通过通道级自适应选择融合多个时间窗口预测结果,有效减轻误差累积。模型仅需9年训练数据,通过物理约束和空间连贯性利用实现高数据效率。实验表明,该模型能自适应
1、研究动机
现有的数据驱动海洋预报模型,局限于日分辨率,无法适应海洋变量的多尺度时间动态;垂直覆盖不足(大多≤700m)。
为此,作者构建 FuXi-Ocean ,首个数据驱动的全球海洋预报模型,实现6 小时时间分辨率、1/12° 涡旋分辨率、0-1500m 深度覆盖,解决亚日尺度预报的误差累积与多尺度时间动态建模问题。
2、模型特性
- 时空覆盖能力: 6 小时时间步长(符合业务预报标准)、1/12° 全球网格(2160×4320 像素)、20 个深度层(0-1500m,表层加密以捕捉海气相互作用)。
- 预报变量: 温度(T)、盐度(S)、海流纬向 / 经向分量(U/V)、海面高度(SSH),共 81 个通道(4 个变量 ×20 个深度层 + SSH)。
3、核心贡献
(1)自适应多尺度时间动态建模架构: 针对不同海洋变量的时间演化差异(如海面温度的日周期 vs 深海海流的慢演化),设计自回归架构,无需统一处理所有变量,而是为每个变量和区域自适应学习时间上下文。
(2)Mixture-of-Time(MoT)模块: 通过通道级自适应选择,融合多个时间窗口的预测结果,减轻序列预报中的误差累积。实现机制:

(3)高数据效率设计: 仅使用 9 年训练数据(2006-2014 年 HYCOM 再分析数据),远少于同类模型需求。通过物理约束整合与空间连贯性利用,在有限数据下避免过拟合,实现高性能预报。
4、整体架构
如下图所示,模型的输入是连续 4 个时间步的全球海洋状态数据(对应 Xt−3,Xt−2,Xt−1,XtX^{t-3}, X^{t-2}, X^{t-1}, X^{t}Xt−3,Xt−2,Xt−1,Xt),每个时间步间隔 6 小时,覆盖 24 小时的历史上下文(用于捕捉日周期、惯性振荡等关键海洋动态)。数入数据维度为CxHxW,其中 C=81通道(4个核心变量X 20个深度层+1个海面高度SSH),H =2160、W =4320 对应 1/12° 全球网格。

图中的 M 为先验信息网络,提取并编码与海洋预测相关的 “时空先验信息”,为后续特征提取提供辅助上下文,帮助模型区分区域特异性模式(如西边界流、季节性混合层)。输入 S 包含时间信息、空间信息。输出FsF_sFs为融合后的时空上下文特征张量,用于调制后续编码器的权重。
共享编码器E为卷积神经网络,将原始海洋状态(如温度、盐度的原始数值)转化为具有物理意义的低维 latent 特征。卷积参数会和FsF_sFs融合,让编码器E对不同区域、不同时间的海洋模式更敏感。编码器输出的特征拼接输入到 Prediction Module。
Prediction module 的结构如下图所示,是N个 attention + FFN + AdaLN 的模块,输出 初步的预测特征。AdaLN 是一个核心改进, 让层归一化的 γ\gammaγ 和 β\betaβ 由时空先验特征 FsF_sFs 动态生成,实现”上下文感知的归一化“。

解码器的输出,经过 Mixture-of-Time(MoT)模块处理,得到预测结果。MoT模块的结构如下图所示。海洋表面变量 存在明显的日周期,需要长时序上下文捕捉昼夜变化规律;海洋深层变量(如 1000m 处的海流)演化缓慢,更依赖近期观测数据捕捉即时流场变化。MoT 模块通过 “变量特异性的时间窗口选择与融合”,解决这个问题。首先计算得到4个预测结果,再计算其与真实值的 MAE 误差,然后进行pooling 和Softmax,得到矩阵 V。如果 V(c,i)V(c,i)V(c,i) 越小,表明第 ccc 个通道在第 iii 个时间窗口的预测越可靠。MoT通过 Top-K 选择最可靠的 K 个时间窗口,再加权生成最终预测。

实验中也发现,对海面温度(需日周期信息),MoT 会选择覆盖 24 小时的长时序窗口。对深层海流(依赖近期观测),MoT 会侧重近期时间窗口,实现 “按需选择上下文”。通过动态选择高可靠性时间窗口,MoT 避免了单一时间上下文的误差传递,使模型在多步自回归预报中(如连续预测多个 6 小时步长),误差增长速率显著低于传统模型。
更多推荐



所有评论(0)