中国科学院大气物理研究所地球系统数值模拟与应用全国重点实验室陈曦研究员团队在数据驱动的集合预报算法研究上取得重要进展。相关研究成果以"生成式超级集合增强天气预报"(Boosting weather forecast via generative superensemble)为题,发表于《npj climate and atmospheric science》。
数据驱动天气预报模型虽已在计算效率和确定性预报技巧上接近传统数值模式,但仍面临预报场过度平滑导致极端事件被系统性低估以及缺乏可靠不确定性量化能力等关键挑战,其根源在于未能显式表征初始条件、模式系统偏差和随机过程三种不确定性来源;同时,随着 AI 气象模式的快速迭代与开源模式激增,缺乏有效融合多模式能力的集合预报框架。针对这些问题,陈曦研究员团队提出基于生成式扩散模型的即插即用集合预报基座 GenEPS(Generative superEnsemble Prediction System),通过学习大气状态的高维概率分布,并采用随机微分方程编辑技术实现高效后验采样,可为任意数据驱动的确定性预报模式赋予集合预报能力(图1左)。
GenEPS技能指标优于ECMWF集合预报系统和NeuralGCM等数据驱动模式。基于ERA5再分析资料的检验显示,10天预报的500 hPa位势高度距平相关系数达到0.691,较ECMWF-ENS提升6.9%(图1右)。在2023年台风"杜苏芮"等极端事件预报中保持了良好的预报场物理一致性(图2),有效模拟出高强度台风眼等精细化特征。

图1 左图:GenEPS算法概念图;右图:2023年全球Z500 ACC多模式性能比较

图2:台风"杜苏芮"7天预报(2023年7月21日00UTC初始)。 (c-f)700 hPa比湿场,包括ERA5验证、ECMWF-ENS成员和GenEPS成员;(g)功率谱分析;(h-j)Pangu、Fengwu和Fuxi的确定性预报场。
GenEPS有效缓解了数据驱动天气预报在不确定性量化和极端事件预报方面的关键问题,在中期预报的确定性和概率性技能上均实现了显著改进。作为即插即用的基座系统,GenEPS为数据驱动天气预报模型提供轻量化的多模式超级集合预报框架。GenEPS未来可接入更多模式成员包括传统数值预报,有望进一步提升预报性能。
中国科学院大气物理研究所科研助理奈聪毅为第一作者,中国科学院大气物理研究所陈曦研究员和潘宝祥副研究员为共同通讯作者。研究得到国家自然科学基金(42275174、42288101)和国家重点研发计划(2022YFF0802001、2024YFF0809004、2024YFB4204800)等项目的共同资助,以及国家重大科技基础设施“地球系统数值模拟装置”(EarthLab)等单位的支持。
论文信息:Nai, C., Chen, X., Yang, S. et al. Boosting weather forecast via generative superensemble. npj Clim Atmos Sci 8, 377 (2025). https://doi.org/10.1038/s41612-025-01255-x