原文:towardsdatascience.com/ai-weather-models-now-outperform-traditional-forecasts-2ad6e33d4346

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/381225dfe1230c41bc128a15b938c4b5.png

作者使用 Midjourney 创建的图像

你是否检查过周末的天气预报并做了计划,结果却被雨淋了?那么你可能对天气预报的可靠性产生了疑问。

预测天气是困难的。大气是一个具有许多未知数的混沌系统。传统的气象模型需要复杂的数值方法来预测大气的未来状态。

在过去五十年中,气象服务建立了一个包含 再分析数据 的气象档案。在卫星观测、地面气象站和数值天气预报的推动下,这个档案代表了我们所知的过去天气。

气象预报中的 AI 革命

五年前,气象预测中的 AI 革命开始了。研究人员利用过去 50 年的再分析气象档案,开发了 AI 模型 来预测天气。

这些模型从训练数据中学习天气模式。在推理过程中,它们获取大气的当前状态并输出未来状态。这可以迭代应用,使模型能够预测数天。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/e28c2345d84169d95d3adc7acd17ba50.png

AI 气象模型和传统数值气象模型。作者创建的图像。图标使用 Midjourney 生成。

AI 气象模型通常在 25 公里的空间分辨率下运行,这是训练数据的空间分辨率。相比之下,高分辨率数值气象模型 在 9 公里的空间分辨率下运行。

对于中程 AI 气象预报,提前 10 天,典型的时间分辨率 为六小时。

当前 AI 气象模型

过去两年,AI 气象模型的数量激增。WeatherBench 项目全面评估了它们。我们在这里关注那些在操作环境中评估过的模型,即使用与数值天气预报相同的数据初始化。

  • PanguWeather 由华为开发。它使用一个针对 3D 地球的特定变压器架构。

  • GraphCast 由 Google DeepMind 开发。它基于图神经网络(GNN),采用编码器-处理器-解码器架构。

WeatherBench 列出了一些模型,例如 NVIDIA 的 FourCastNet,Ryan Keisler 的 图网络,以及类似级联的 伏羲模型,这些模型已经用再分析数据初始化。因为这些预报会有五天的延迟,所以它们还没有准备好投入实际使用。

天气预报的指标

作为机器学习专家和数据科学家,我们习惯于使用准确率、精确度或召回率等指标。机器学习专家 Andrew Ng 建议使用单一指标来评估性能。

但天气预报需要不止一个指标。不同的用户对不同的量感兴趣。农民想知道 24 小时内的降雨量,游客关注地表温度,而太阳能预报依赖于云层覆盖。

天气预报是通过评分卡来评估的。面板显示了 WeatherBench 2 项目的一个评分卡,重点关注影响我们日常生活的关键表面天气变量。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/3c72db1a9575b0e04489aa76abc1d374.png

2020 年表面变量评分卡。来源:Rasp 等人,WeatherBench 2 arxiv.org/pdf/2308.15560.pdf

通过均方根误差(RMSE)将不同的气象量与“真实情况”进行比较,包括实际天气观测以及天气模型。

当前的黄金标准是 ECMWF 高分辨率预报,IFS HRES。对于这个参考模型以及人工智能天气模型,都计算了均方根误差(RMSE)。评分卡的颜色表示模型相对于参考模型的表现是否更好(蓝色)或更差(红色)。

专注于运营中的 GraphCast 模型,我们发现它比参考模型更好地预测温度、地表压力和近地表风速。只有对于短期降水,IFS HRES 才优于 GraphCast。

除了表面变量外,气象学家还喜欢比较大气高层中的天气预报模型。正确地获取这些数据对于 15 天内的中期预报尤为重要。

面板显示了大气压力为 500 hPa(约地面以上 5.5 公里)处的位势高度。GraphCast 模型持续优于 IFS 高分辨率模型。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/5f76cd0be03546f173f92298c3f771b4.png

GraphCast 模型和 IFS 高分辨率模型在 2018 年的 500 hPa(z500)位势高度上的技能得分。来源:Lam 等人,《GraphCast:学习熟练的中程全球天气预报》,arxiv.org/abs/2212.12794

用户可以在WeatherBench 项目网站上尝试并直接比较不同的模型。

极端事件

AI 气象模型在跟踪台风方面表现出色的一个领域是,预测台风将登陆何处是困难的,而早期预警对于沿海地区的疏散计划至关重要。

PanguWeather 是第一个声称其性能优于数值天气预报的 AI 气象模型。面板显示了两个台风路径,我们观察到 PanguWeather 预测的台风路径与地面真实情况吻合良好,而高分辨率预报则有偏差。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/b6b132b68c27c53d81dcf6947e0b6610.png

台风路径预报。来源:Bi 等人,《Pangu-Weather:一种快速且精确的全球天气预报的 3D 高分辨率模型》,arxiv(2022)

另一方面,确定性 AI 气象模型可能无法捕捉到一些低概率发生的极端事件。传统的天气预报在最多 50 个成员的集合中运行,这允许对未来天气条件的概率模型进行建模。

AI 气象模型的成本

传统的数值天气预报需要大量的计算时间。欧洲中期天气预报中心(ECMWF)在英国雷丁和意大利博洛尼亚运营超级计算机,每天四次产生高分辨率预报。

相比之下,使用 AI 气象模型进行推理在单个 TPU 或 GPU 上不到一分钟。这减少了预报所需的能量,将预报所需的能量减少了 12000 倍。

您甚至可以按照我的教程创建自己的 AI 气象预报:

如何创建您自己的 AI 气象预报

虽然推理成本很小,但我们不应忽视生成训练数据和训练 AI 气象模型所需的计算资源。

生成训练数据的成本难以量化。一个人必须加上过去几十年中用于生产再分析数据的所有能量。为了公平起见,这个数据集已经生成,并且只是简单地用于训练。

PanguWeather 在 192 个 NVIDIA Tesla-V100 GPU 上训练了 16 天。GraphCast在一个由 32 个 Cloud TPU v4 设备组成的集群上训练了 28 天。根据Google Cloud 计算器,这项服务的费用大约为 38,000 美元。


这对未来数值天气预报意味着什么?

AI 气象模型在多个指标上优于数值天气预报。然而,投资于数值天气预报有很好的理由:

  • 高分辨率数值天气预报是 AI 气象模型的基础。它们提供训练数据和初始化。

  • 气象学家努力更好地理解天气科学。在过去,这提高了天气预报。

  • 气候变化影响了 AI 气象模型所学习到的天气模式。数值天气预报受这种数据漂移的影响较小。

  • 数值天气预报比 AI 气象模型提供更好的空间和时间分辨率

  • 本地化极端事件,如 2021 年西欧的严重洪水,在用均方误差损失训练的 AI 气象模型中可能会被冲淡。

AI 气象模型未来的方向

现在许多实验室都在开发自己的 AI 气象模型,我们预计在不久的将来会看到改进。

随着高分辨率训练数据的可用性,训练新一代 AI 气象模型将是一个技术挑战。将分辨率提高 2 倍,从 25 公里到 12.5 公里,意味着在训练过程中必须处理的数据点数量增加 8 倍。

当前的 AI 气象模型提供的气象变量比传统天气预报少。例如,GraphCast 不预测云量,尽管它在再分析数据中包含。这个变量对于预测光伏发电量是有用的。

已经在今天,气象服务每天都会运行 AI 气象模型。这些模型正在不断地被评估和与现有方法进行比较。在ECMWF 主页上,用户可以查看由各种 AI 气象模型生成的预报。

摘要

人工智能天气预报模型现在与数值天气预报模型具有竞争力。它们可以利用过去 50 年的广泛天气档案并产生可靠的预报。

很可能人工智能天气预报模型将在不久的将来集成到实际天气预报中。它们正在被密切监控并进一步改进。

这并不意味着传统的数值天气预报已经死亡——准确的物理大气模型是至关重要的,不能被人工智能所取代。

最后,价格低廉且易于获取的人工智能天气预报模型,其中许多是开源的,可以民主化天气预报的获取。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/92e9da525d09be1977af732fb4851817.png

作者使用 Midjourney 创建的图片。

链接

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐