主要

短时预测被定义为世界气象组织(WMO)预测收益率当地在中尺度和小规模的细节,在一段时间内从现在到6 h,它提供了一个详细描述现在的天气1。短时预测是至关重要的在极端降水预防风险和危机管理,通常定义为第95百分位的日常降水的累积频率分布2。据世界气象组织最近的一份报告3在过去50年里,超过34%的所有记录灾难,有关死亡人数的22%(101万年)和相关经济损失的57%(2.84万亿美元)是极端降水事件的后果。

天气雷达回波在sub-2-km提供云观测空间分辨率和5分钟时间分辨率,适合降水短时预测6。自然选择利用这些数值天气预报数据,产生降水的预测基于大气的解耦合的基本方程7。然而,这些方法,即使在超级计算平台上实现,限制了数值天气预报预测更新周期中尺度的时间和空间分辨率,而极端天气过程通常表现出一生的十分钟在对流规模和个人特性4,8,9。替代方法如飞镖10和pySTEPS9是基于平流方案完全由连续性方程的启发。这些方法分别解运动领域的未来状态和剩余强度复合雷达观测和迭代用平流输送过去雷达领域来预测未来。平流方案部分方面的物理守恒定律降水中能够提供熟练地推断进化和1 h,但它超越地平线,迅速降解,导致高位置误差和失去小对流特性。这些错误积累的自回归平流过程不受控制的方式11现有平流实现,由于未能将非线性演化模拟和优化端到端预测错误。

深度学习方法应用近年来天气短时预测12,13,14,15,16。这些方法利用大全集复合雷达观测来训练神经网络模型在一个端到端的时尚,摒弃明确提及降水过程背后的物理定律。他们已经被证明是有用的低强度降雨以per-grid-cell衡量指标等关键成功指数(CSI)4。一大进步在这个设置雷达的深层生成模型(DGMR)方法由DeepMind和英国气象局4。这种方法生成的时空一致预测交货时间90分钟,同时捕捉混沌对流细节和占集合预报的不确定性。专家评价的50多名从英国气象局气象学家,DGMR排名第一在89%的情况下对相互竞争的方法,包括pySTEPS advection-based方法9。仍然为极端降水,DGMR状况可能产生短时自然运动和强度,高位置误差和大云耗散增加交货期4。这些问题反映了一个事实,雷达回波只是部分大气系统的观察。深度学习模型纯粹基于雷达数据分析阻碍的能力来捕获底层沉淀全面的物理现象5。我们相信,降水过程的物理知识方面,包括云运输的守恒定律10和雨的对数正态分布分布率17,需要嵌入数据驱动模型巧妙短时预测极端降水的可能。

我们现在NowcastNet,极端降水的统一的短时预测模型基于复合雷达观测。它结合了深度学习方法与物理第一原则,通过神经进化神经网络框架,实现运营商对非线性过程建模和预测误差最小化的physics-conditional机制。这个框架使平流保护无缝集成到一个学习模型,成功地预测长寿的中尺度模式和捕捉短暂的对流细节的交货期3 h。我们将展示在美国和中国事件全集,NowcastNet是评判专家的预测比pySTEPS气象学家更准确和启发性,DGMR或其他深度学习系统。

NowcastNet

有技巧的重点学科,需要利用物理第一原理和统计学习的方法。NowcastNet提供了这样一个统一使用神经网络框架,允许端到端预测误差的优化。我们的短时预测算法(无花果。1)是一个physics-conditional深生成模型,利用雷达估计地表降水预测未来雷达领域\({\帽子{{\ bf {x}}}} _ {1: T} \)鉴于过去雷达领域\ ({{\ bf {x}}} _ {{T} _ {0}: 0} \)。模型包括一个随机生成的网络参数化θ和确定性演化网络参数化ϕ。短时预测过程是基于physics-conditional代从潜在的随机向量z,被

$ $ P({\帽子{{\ bf {x}}}} _ {1: T} | {{\ bf {x}}} _ {{T} _{0}: 0}, \ \φ;\θ= \ int \ P({\帽子{{\ bf {x}}}} _ {1: T} | {{\ bf {x}}} _ {{T} _{0}: 0}, \φ({{\ bf {x}}} _ {{T} _ {0}: 0}), {\ bf {z}} \,; \θ)P ({\ bf {z}}) {rm \ d {}} {\ bf {z}}。$ $
(1)

集成在潜在的高斯向量z使集合预报和预测巧妙地捕捉关键混沌动力学4

图1:NowcastNet极端降水短时预测。
图1

一个physics-conditional深NowcastNet的体系结构,生成模型。短时预测编码器需要美国所有企业提供学习上下文表示。physics-informed演进的短时预测解码器需要美国所有企业提供条件\ ({{\ bf {x}}} _ {1: T} ^ {{\ ' \ '}} \)和转换从一个潜在的高斯向量z中尺度和convective-scale预测\({\帽子{{\ bf {x}}}} _ {1: T} \)b、进化网络神经实现平流方案通知的2 d连续性方程,实施符合中尺度降水物理和输出的预测\ ({{\ bf {x}}} _ {1: T} ^ {{\ ' \ '}} \)c神经算子迭代进化算子,用平流输送x0在运动领域v1:T得到\ ({{\ bf {x}}} _ {1: T} ^ {{\ '}} \)和增加强度剩余工资年代1:T得到\ ({{\ bf {x}}} _ {1: T} ^ {{\ ' \ '}} \)。降水数据从mrm获得26数据集和地图生产cartopy地球和自然。

虽然我们的工作适合在一个新线程physics-informed神经网络的研究5在降水领域有很多挑战,不容易适应现有的研究。最值得注意的是,大气物理学的多尺度特性介绍了紧急几个时空尺度之间的依赖关系和对固有限制大气可预测性8。特别是,对流过程受到混乱的误差增长不确定初始条件,限制平流方案20公里的空间尺度和1 h (ref的交货时间。18)。天真的组合神经网络和物理原理缠绕多尺度可变性和腐败的中尺度和convective-scale模式,产生不良的混淆和不受控制的错误。

我们解决多尺度问题的一种新的调节机制,数据驱动生成网络θ促进了advection-based进化网络ϕ(无花果。1)。进化网络实施符合降水的物理,身体产生合理的预测\ ({{\ bf {x}}} _ {1: T} ^ {{\ ' \ '}} \)对流特性在20公里的规模。短时预测解码器将需要美国所有企业提供的短时预测编码器需要美国所有企业提供表示过去的雷达领域\ ({{\ bf {x}}} _ {{T} _ {0}: 0} \)随着进化网络预测\ ({{\ bf {x}}} _ {1: T} ^ {{\ ' \ '}} \),并生成细粒度预测\({\帽子{{\ bf {x}}}} _ {1: T} \)从潜在的高斯向量z可以捕获1-2-km尺度对流特性。如此规模的解开纠结减小误差传播高档或缩减规模的多尺度预测框架19。我们使用空间自适应标准化技术20.使自适应进化的调节机制。在每一个传球前进,every-decoder-layer激活的均值和方差是取代空间相应的统计计算从演化网络的预测\ ({{\ bf {x}}} _ {1: T} ^ {{\ ' \ '}} \)。因此,NowcastNet自适应结合中尺度模式由物理定律和convective-scale细节透露了雷达观测,收益率娴熟的多尺度预测与3 - h交货时间。

学习是陷害的训练条件生成对抗的网络21,鉴于pre-trained进化网络编码的物理知识。时序鉴别器是基于短时预测解码器需要美国所有企业提供,以作为输入特性的金字塔在几个时间窗口和输出输入是否可能是真正的雷达或一个假的领域。短时预测编码器和译码器都需要美国所有企业提供培训和一个敌对的损失产生对流细节出现在雷达观测但advection-based进化网络。状况,生成的短时需要空间与雷达观测一致。这是通过连接池正规化,执行状况spatial-pooled合奏短时和spatial-pooled观测之间的一致性。pooling-level一致性更宽容的空间混乱在现实领域,能够解决生成网络和演化网络之间的冲突。

进化网络

NowcastNet使多尺度短时预测通过调节数据驱动(随机)生成网络θadvection-based(确定性)进化网络ϕ。在大气物理学,连续性方程是基本守恒定律管理云运输和降水演变。它激发了一系列的操作平流方案22模型降水演变为成分的平流运动领域,除了强度残差。然而,以前平流方案的实现,例如,pySTEPS,不足三个方面:(1)平流操作不可微的,因此不能很容易嵌入到一个端到端的基于神经框架梯度优化;(2)它们的稳态假设限制了实现线性政权,未能提供非线性建模能力降水模拟的关键;和(3)他们自回归自然,也就避免了直接优化的预测错误和错误的估计初始状态,运动领域和强度残差将积聚在一个拉格朗日持久性模型控制的方式8

我们迫切需要得到解决这些东西进化网络(图。1 b),它实现了2 d连续性方程10通过神经进化方案。一个新的可微神经进化算子的基础上,学习运动领域,残差和降水强度字段同时通过神经网络;此外,它直接基于优化的整个时间范围的预测误差梯度反向传播。

我们physics-informed进化网络是建立在一个新的可微的神经进化算子(无花果。1 c)。进化算子采用当前雷达领域x0作为输入,并预测未来雷达领域x1:T。在每个时间步,雷达领域预测在最后时间步\ ({{\ bf {x}}} _ {t - 1} ^ {{\ ' \ '}} \)由一步进化的平流运动vt获得\ ({{\ bf {x}}} _ {t} ^ {{\ '}} \)和剩余强度年代t然后添加到屈服吗\ ({{\ bf {x}}} _ {t} ^ {{\ ' \ '}} \)。操作员所有字段和运动强度剩余工资可学的基于端到端通过梯度优化,由现有的平流方案。当与反向传播学习算子,我们停止每个时间步块之间的梯度信息干扰。这减轻了数值不稳定引起的整个系统的欠定的性质,不连续篡改的进化算子。

进化网络增强encoder-decoder架构,同时预测运动领域v1:T和强度残差年代1:T在未来所有的时间步骤根据以往的雷达领域\ ({{\ bf {x}}} _ {{T} _ {0}: 0} \)。这样一个完整的过去和未来之间的依赖关系的时间步骤减轻了非平稳序列预测问题。进化编码器,译码器译码器和强度运动神经网络(无花果。1 b),使非线性演化建模,先前的平流方案难以捕捉。

直接学习进化网络框架的优化预测误差在整个时间范围。积累的错误出现在进化算子,以进化领域之间的距离的总和\ ({{\ bf {x}}} _ {t} ^ {{\ ' \ '}} \)和观察到的雷达xt。因为每个进化的步骤包括解决运动领域vt和剩余强度年代t快捷的梯度路径的端到端优化,我们采用残余学习的概念23并进一步计算流水领域之间的距离的总和\ ({{\ bf {x}}} _ {t} ^ {{\ '}} \)和观察到的雷达xt。结合这两个的距离导致累积的损失。此外,部分灵感连续性方程和部分的大降水模式往往是比小的更长的生活8,我们进一步设计motion-regularization项运动领域流畅的网格重的降水。具体来说,运动的空间梯度字段v1:T计算是索贝尔过滤器吗24被雨水和梯度准则,加权率、使用规范。

评价设置

我们评估NowcastNet与最先进的降水的预报技巧和价值短时预测模型。pySTEPS9advection-based方法,已经在世界范围内广泛采用气象中心运营重点学科25。PredRNN13数据驱动的神经网络,在中国气象局部署。DGMR4基于深,合奏短时预测方法生成模型与集成领域知识,例如,时空一致性的云层和重尾分布的降雨,展示了最好的预测能力和价值评估由英国气象局的专家。

所有模型训练和测试雷达大型语料库的美国和中国的事件,包括作物在定长系列从雷达中提取流。一个重要性抽样策略4用于创建数据集更具代表性的极端降水事件。在美国语料库,我们使用雷达多传感器(mrm)数据集26与雷达观测和模型训练年2016 - 2020年和2021年的评估。在中国语料库,我们使用中国气象局提供的私人数据集,与雷达观测从2019年9月到2021年3月培训,从2021年4月到2021年6月进行评估。虽然中国语料库规模较小、底层天气系统由于地理多样性更复杂。为了避免过度拟合,我们使用一个传输学习策略27在美国,所有模型pre-trained训练集中国训练集和调整。

NowcastNet可以产生高分辨率字段在推理时间以秒为单位。我们报告两个主要定量指标:沪深附近28测量位置状况的准确性短时和功率谱密度(PSD)29日测量降水变化状况基于光谱特征的短时与雷达观测。

降水事件

我们研究降水事件从9点半开始UTC时间2021年12月11日(无花果。2),这是龙卷风爆发在美国东部的一部分。首先,几行强烈的风暴在密西西比河流域和向东移动开发的;之后,他们聚集到一个对流细线拉伸以及相关的冷锋和彻底的从肯塔基东部到阿拉巴马州。这个降水事件导致数十个龙卷风,大面积的暴雨和直线风的速度达到每小时78英里。预测的细线,黄线所代表的回声在雷达领域,是非常具有挑战性的。

图2:案例研究降水事件从2021年12月11日开始,有一个很大的对流和龙卷风爆发在美国东部。
图2

NowcastNet能够预测convective-fine-line演进和细节在较长时间内。一个、地理环境的预测。b,一个单一的预测T+ 1 h,T+ 2 h和T+ 3 h交货期为不同的模式。c16毫米h, CSI附近阈值−1和32毫米h−1d在不同的波长,PSD。图像放大768公里×768公里突出当地的细节。降水数据从mrm获得26数据集和地图生产cartopy地球和自然。

源数据

pySTEPS预测未来雷达领域良好的清晰度,但发生大的位置误差和未能保持线的形状回声1 h。PredRNN只提供的预测趋势但大纲过于模糊,失去了多尺度模式用于气象学家预测。DGMR能够维持对流细节,但遭受自然的云消散,产生大的位置误差和低估了强度。更糟的是,线的形状预测的DGMR过分扭曲。整个3 - h事件,NowcastNet是唯一的方法可以准确地预测细线的运动和保持雨的信封区。线回波覆盖强烈降雨(> 32毫米h−1),NowcastNet达到CSI尤其的好。NowcastNet也达到最高的PSD所有波长(即空间尺度上),收益率大幅的、一致的状况和多尺度短时指地面真理。

我们调查另一个降水事件开始于2021年5月14日23:40 UTC江淮地区的中国(图。3),这几个城市发出红色暴雨警告。三个对流细胞进化的不同。第一个单元格从东北的中心,发展成弓回声从单细胞雷暴的回声。第二个单元格是飑线从西南到中间,用尾巴向东移动。第三单元之间,表现出稳定增长。

图3:案例研究降水事件开始于2021年5月14日,与几个对流细胞和红色暴雨警告中国在江淮地区。
图3

NowcastNet是唯一的方法可以预测多尺度演进的三个对流细胞在较长时期。一个、地理环境的预测。b,一个单一的预测T+ 1 h,T+ 2 h和T+ 3 h交货期为不同的模式。c16毫米h, CSI附近阈值−1和32毫米h−1d在不同的波长,PSD。图像放大768公里×768公里突出当地的细节。降水数据来自中国气象局和地图生产cartopy地球和自然。

源数据

受物理守恒定律的不服从,PredRNN DGMR遭受快速耗散和无法预测的进化对流细胞2 h交货期。pySTEPS预测的方向三个细胞,但不能预测特定位置或形状的变化。相比之下,NowcastNet收益率状况合理的短时演进的三个单元3 - h交货时间。飑线的状况虽然短时和日益增长的细胞仍不完美,他们对于气象学家非常有用。定量结果NowcastNet CSI的邻里和PSD大幅提高相对于主要的方法。

我们检查和极端降水天气事件,对流起始,光降雨和扩展数据无花果的典型流程。2- - - - - -8和补充无花果。2- - - - - -5。状况高分辨率短时2048公里×2048公里扩展数据无花果所示。910

气象学家评估

我们评估不同模型的预测价值的极端降水事件从英国气象局的气象学家评估协议4。公平,中国气象局公开邀请高级气象学家在中国参与评估。在公开网站上,专家们可以控制的状况,但短时降水字段显示不同的模型显示匿名的秩序。最后,62年从中央和23个省级气象学家天文台专家完成了评估,每个15判断测试用例选择随机从extreme-precipitation-event子集。美国和中国子集包含1200极端事件发生超过93天,2021年50天内从2021年4月到2021年6月,分别。我们注意到,尽管从美国事件,中国气象学家可能会产生一些偏见,我们期望它相对较小,随着全球天气系统底层物理原理和股票两国气象观测和技术分享。

我们增加英国气象局协议通过运行两种类型的评价:之前后评价和评估。后评估、气象学家要求客观地评价每个模型的预测的预测价值,参照未来真实的观察。在评估之前,气象学家需要主观等级预报值鉴于过去雷达系列,但没有看到未来地面实况。这个协议模拟真实的场景,在该场景中,未来的观测是无法访问和气象学家必须做出一个动态选择模型是首选的短时预测。

气象学家评价的统计图所示。4 a、b。后评估,NowcastNet被评为美国事件的首选75.8%([72.1,79.3])和67.2%的中国事件([63.1,71.1])。在评估之前,NowcastNet被评为首选美国71.9%的事件([66.6,76.8])和64.4%的中国事件([58.9,69.7])。括号里的数字是95%置信区间。NowcastNet拥有最高的气象学家偏好状况提供熟练的短时展览物理合理性和多尺度特性,而其他模型斗争。

图4:气象学家评价和定量评价的美国和中国的数据集。
图4

一个气象学家评估美国事件的第一选择偏好的基础上每个模型。黑色横线表示Clopper-Pearson 95%置信区间。气象学家大幅首选NowcastNet其他竞争对手(n= 62,P< 10−4)。b,中国气象学家评估事件。气象学家大幅首选NowcastNet其他竞争对手(n= 62,P< 10−4)。c在2021年美国事件的量化分数。第一行显示了不同模型的CSI附近16毫米的降水阈值h−1,32毫米h−1h和64毫米−1。第二行显示了PSD超过1024公里×1024公里的不同模型预测T+ 1 h,T+ 2 h和T+ 3 h交货期。d,定量的分数从2021年4月到2021年6月中国事件。

源数据

定量评价

我们提供了一个定量评价的基础上,CSI邻里和PSD图所示的结果。4 c, d。评估包括U-Net30.对降水短时预测,一个共同的基准。采用重要性抽样DGMR的协议4来自美国和中国的,我们样品两个子集全集,两个极端降水事件的代表。CSI附近,NowcastNet状况产生更准确的短时降雨率较高(> 16毫米h−1)。PSD, NowcastNet收益率状况更短时谱更加一致的可变性的特点为3 - h领先雷达观测时间。这些量证明NowcastNet是极端降水短时预测技术,能更好地预测降水模式在中尺度对流尺度,同时保持在较长时期进化的高精度预测。

在补充无花果。10- - - - - -17下,我们提供进一步的定量评估uniform-sampling和重要性抽样协议4

结论

降水短时预测是主要的气象科学的长期目标。尽管已经取得了进展,数值天气预报系统目前状况无法提供熟练的短时为极端降水事件需要与天气相关的决策。

的短时预测源于固有的困难多尺度和多重物理量在大气中出现的问题和需要结合物理第一原理与统计学习方法在一个严格的方式。我们的工作地址这一挑战使用端到端优化框架,结合体格进化方案和conditional-learning方法。由此产生的模型、NowcastNet为身体状况合理的短时提供高分辨率,很长的时间和当地极端降水事件的细节,现有方法的斗争。

未来的工作是需要改善降水短时预测技巧。一个方向是整合更多的物理动量守恒等原理。另一个方向是开发更多的卫星观测等气象数据。我们希望这将激励未来的研究方向。

方法

该模型的详细解释,以及基线数据和评估,给出了在这里,扩展数据的引用的无花果。和补充信息添加到结果中提供的主要文本。

模型的细节

我们与重要的细节描述NowcastNet模型的体系结构、训练方法和hyperparameter调优策略。烧蚀研究NowcastNet有补充信息部分一个

进化网络

2 d连续性方程修改降水演变31日

$ $ \压裂{\部分{\ bf {x}}}{\部分t} + ({\ bf {v}} \ cdot \微分算符){\ bf {x}} = {\ bf{年代}}。$ $
(2)

在这里x,v年代显示雷达组合反射率、运动字段和残余强度字段,分别表示梯度算子。趋势项(v)x揭示了大规模离开系统的一阶近似平流操作:之前和之后的差异

$ $ \压裂{{\ bf {x}} ({\ bf {p}} + \δt \ cdot \δ{\ bf {v}}, t + \δt) - {\ bf {x}} ({\ bf {p}}, t)}{\δt}, $ $
(3)

pt分别是位置和时间。剩余的字段年代显示了添加剂进化机制,如降水强度的增长和衰减。根据连续性方程,可以将沉淀的时间演化建模为一篇作文的平流运动领域,除了强度残差,这是进化的进化算子我们设计网络。我们同时使用深神经网络预测所有这些字段根据以往的雷达观测,使非线性建模复杂的降水演变能力。

进化网络(图。1 b过去的雷达观测)作为输入\ ({{\ bf {x}}} _ {{T} _ {0}: 0} \)并预测未来雷达领域\ ({{\ bf {x}}} _ {1: T} ^ {{\ ' \ '}} \)从规模基于非线性,在本文中,我们提出具体可学的发展方案。扩展数据描述的体系结构细节图。1。进化的骨干网络是一个双通道U-Net30.学习,共同进化编码器上下文表示,运动学习的译码器运动领域v1:T和一个强度解码器的学习强度残差年代1:T。光谱归一化技术32应用卷积在每一层。U-Net,跳过连接的所有输入和输出字段连接在时间维度,也就是说,在卷积网络渠道。

进化算子(无花果。1 c)是进化的核心网络。我们使用落后的semi-Lagrangian方案平流算子。因为v1:T是可学的,我们直接把它作为semi-Lagrangian的离职补偿计划。另外,因为年代1:T是可学的,我们直接用它来模型降水强度的增长或衰退。我们以降水率代替雷达反射率为雷达领域的单位x,因为这种修改不会影响演化过程的物理本质。应用双线性插值的几个步骤将模糊降水领域,我们在向后semi-Lagrangian选择最近的插值方案计算\ ({{\ bf {x}}} _ {t} ^ {{\ '}} \)。然而,最近的插值不是可微v1:T。我们解决这个梯度困难通过使用双线性插值(并)用平流输送\({\离开({{\ bf {x}}} _ {t} ^{{\ '}} \右)}_ {{\ rm{箱内}}}\)\ ({{\ bf {x}}} _ {t - 1} ^ {{\ ' \ '}} \),v1:T,并使用\({\离开({{\ bf {x}}} _ {t} ^{{\ '}} \右)}_ {{\ rm{箱内}}}\)计算累积损失优化运动领域。然后我们使用最近的插值计算\ ({{\ bf {x}}} _ {t} ^ {{\ '}} \)\ ({{\ bf {x}}} _ {t - 1} ^ {{\ ' \ '}} \),v1:T,进化计算领域\ ({{\ bf {x}}} _ {t} ^ {{\ ' \ '}} = {{\ bf {x}}} _ {t} ^ {{\ '}} + {{\ bf{年代}}}_ {t} \)。每一轮的进化操作符之后,我们之间的梯度分离两个连续的时间步骤,因为整个系统是欠定的。与此同时,连续插值操作将端到端优化不稳定,和分离梯度(停止梯度图。1 c)将显著改善数值稳定性33

培训发展网络的目标函数由两部分组成。第一部分是累积损失,这是加权之和l1实际观察和预测之间的距离:

$ $ {J} _ {{\ rm {accum}}} = \ mathop{总和\}\ limits_ {t = 1} ^ {t} \离开({L} _ {{\ rm {wdi}}} \离开({{\ bf {x}}} _ {t},{\离开({{\ bf {x}}} _ {t} ^{{\ '}} \右)}_ {{\ rm{箱内}}}\右)+ {L} _ {{\ rm {wdi}}} \离开({{\ bf {x}}} _ {t}, {{\ bf {x}}} _ {t} ^{{\ ' \ '}} \) \右),$ $
(4)

特别是,加权距离具有以下形式:

$ $ {1}_ {{\ rm {wdi}}} \离开({{\ bf {x}}} _ {t}, {{\ bf {x}}} _ {t} ^{{\ '}} \右)={\左\绿色\左({{\ bf {x}}} _ {t} - {{\ bf {x}}} _ {t} ^ {{\ '}} \) \ odot {\ bf {w}} \离开({{\ bf {x}}} _ {t} \) \右\绿色}_ {1},$ $
(5)

pixel-wise重量w(x(1 +)= min(24日x)是取自DGMR4。因为雨率大约遵循对数正态分布分布17,有必要增加重量平衡不同降雨水平。否则,神经网络将只适合轻型和中型降水采取主导比例数据和极端降水不会占足够。我们遵循DGMR4并使用雨体重成正比的速度和夹在24对鲁棒性不合逻辑地大型雷达观测值。

第二部分是motion-regularization项梯度的形式规范,由连续性方程和动力部分部分,大降水模式往往是比小的更长的生活8:

$ $ {J} _ {{\ rm{运动}}}= \ mathop{总和\}\ limits_ {t = 1} ^ {t} \离开({\平行\微分算符{{\ bf {v}}} _ {t} ^ {1} \ odot \√6 {{\ bf {w}} ({{\ bf {x}}} _ {t})} \平行}_{2}^{2}+{\平行\微分算符{{\ bf {v}}} _ {t} ^ {2} \ odot \√6 {{\ bf {w}} ({{\ bf {x}}} _ {t})} \平行}_{2}^{2}\右),$ $
(6)

在这\ ({{\ bf {v}}} _ {t} ^ {1} \)\ ({{\ bf {v}}} _ {t} ^ {2} \)两个组件的运动领域。的梯度运动领域v计算大约Sobel过滤器吗24:

$ ${\部分}_ {1}{\ bf {v}} \大约\离开(\开始{数组}{ccc} 1 & 0 & 1 \ \ 2 & 0 & 2 \ \ 1 & 0 & 1 \结束数组{}\)\ \ ast \ {\ bf {v}} \ qquad{\部分}_ {2}{\ bf {v}} \大约\离开(\{数组}{ccc} \开始,1 & \ 2 & \ \ \ \ 1 0 & \ 0 & \ 0 \ \ 1 & 2 & 1 \结束数组{}\)\ \ ast \ {\ bf {v}}, $ $
(7)

⁎表示的二维卷积算子空间维度。

总的来说,培训的目的进化网络(无花果。1 b)是

$ $ {J} _ {{\ rm{进化}}}= {J} _ {{\ rm {accum}}} + \λ{J} _ {{\ rm{运动}}}\,$ $
(8)

培训期间,我们样品256×256的雷达领域空间大小作为输入。在美国和中国的数据集,我们解决输入长度T0= 9,设置输出长度T= 20培训和前18预测领域进行评估。注意,增加T0没有提供实质性的改进和T0≥4就足够了。hyperparameter的权衡λ设置为1×10吗−2。我们用亚当的优化器34批量大小的16 - 1×10的初始学习速率−3,火车3×10的进化网络5迭代,在此期间我们衰变1×10的学习速率−4在2×105迭代。

生成网络

空调在进化网络预测\ ({{\ bf {x}}} _ {1: T} ^ {{\ ' \ '}} \),生成网络作为输入过去雷达观测\ ({{\ bf {x}}} _ {{T} _ {0}: 0} \)并从潜在的随机向量生成z最后预测降水字段\({\帽子{{\ bf {x}}}} _ {1: T} \)在1-2-km规模。生成的骨干网络是一个U-Net encoder-decoder结构,与建筑细节扩展数据图所示。1 b。短时预测编码器需要美国所有企业提供具有相同结构的进化编码器(扩展数据图。1),这将作为输入的连接\ ({{\ bf {x}}} _ {{T} _ {0}: 0} \)\ ({{\ bf {x}}} _ {1: T} ^ {{\ ' \ '}} \)。短时预测译码器是一个不同的卷积需要美国所有企业提供网络,将作为输入从短时预测编码器需要美国所有企业提供上下文表示,随着潜在的高斯向量的变换z。D块的设计,S块和空间规范生成网络中大量使用了扩展数据图。1 e

高斯噪声投影变换的向量z相同的空间大小的上下文表示短时预测编码器,需要美国所有企业提供扩展数据图阐述了。1 d。对于每一个传球前进,每个元素z从标准的高斯独立采样\ ({\ mathcal {N}} (0,1) \)。然后z噪音投影仪变成是一个张量与输入雷达观测高度和宽度的八分之一。

physics-conditioning机制融合生成网络和演化网络由应用空间自适应实现正常化20.每个卷积层的短时预测解码器需要美国所有企业提供(扩展数据图。1 b, e)。首先,每个通道的短时预测解码器需要美国所有企业提供规范化的parameter-free instance-normalization模块35。然后进化网络预测\ ({{\ bf {x}}} _ {1: T} ^ {{\ ' \ '}} \)调整到一个兼容的空间大小,然后连接到短时预测解码器需要美国所有企业提供在相应层通过平均池。最后,一个两层的卷积网络将调整预测转换为新的均值和方差对每个通道的短时预测解码器需要美国所有企业提供,确保不扭曲spatial-coherent特性从进化网络预测\ ({{\ bf {x}}} _ {1: T} ^ {{\ ' \ '}} \)。通过physics-conditioning机制,生成网络自适应地根据物理知识学习与进化网络,而解决的体格进化之间的固有矛盾和统计学习制度。

调节进化网络预测从规模,生成网络需要进一步产生对流细节在1-2-km范围内通过培训时间鉴别器D(扩展数据图。1 c)。颞鉴别器将作为输入真正的雷达观测\ ({{\ bf {x}}} _ {1: T} \)最后预测领域\({\帽子{{\ bf {x}}}} _ {1: T} \)和输出的可能性有多大是真是假。在它的第一层,输入是由三维卷积处理层与几个内核大小在时间维度从4到完整的地平线。连接的多尺度特性和前馈后续卷积与光谱归一化层32应用于每一层。培训时间鉴别器的目的是

$ $ {J} _ {{rm \ d {}} {\ rm{我}}{\ rm{年代}}{\ rm {c}}} = {1} _ {{\ rm {c}} {\ rm {e}}} (d ({{\ bf {x}}} _ {1: T}), 1) + {L} _ {{\ rm {c}} {\ rm {e}}} (d({\帽子{{\ bf {x}}}} _ {1: T}), 0), $ $
(9)

lce叉的损失。在双人游戏极大极小,生成的短时预测解码器需要美国所有企业提供网络训练混淆时间鉴别器通过最小化的敌对的修改21

$ $ {J} _ {{\ rm{一}}{rm \ d {}} {\ rm {v}}} = {1} _ {{\ rm {c}} {\ rm {e}}} (d({\帽子{{\ bf {x}}}} _ {1: T}), 1) $ $
(10)

梯度backpropagate通过\({\帽子{{\ bf {x}}}} _ {1: T} \)第一,短时预测解码器需要美国所有企业提供,然后生成的短时预测编码器需要美国所有企业提供网络,导致它预测现实多尺度字段convective-scale细节。

我们的想法从DGMR生成集成预测4和一群降水预测领域\({\帽子{{\ bf {x}}}} _ {1: T} ^ {{{\ bf {z}}} _{我}}\)从几个潜在的输入z1:k,k乐团成员的数量。然后我们总k预测\({\帽子{{\ bf {x}}}} _ {1: T} ^ {{{\ bf {z}}} _{我}}\)和真正的领域x1:T分别由max-pooling层在空间维度,内核大小和步设置为5和2,相应。池的基础上整体预测,正规化的定义是之间的加权距离spatial-pooled观察和的均值kspatial-pooled预测

$ $ {J} _ {{rm \ p {}} {\ rm {o}} {\ rm {o}} {\ rm {l}}} = {1} _ {{\ rm {w}} {rm \ d {}} {\ rm{我}}{\ rm{年代}}}\离开(Q ({{\ bf {x}}} _ {1: T}), \压裂{1}{k} \ mathop{总和\}\ limits_ {i = 1} ^ {k} Q({\帽子{{\ bf {x}}}} _ {1: T} ^ {{{\ bf {z}}} _{我}})\右),$ $
(11)

总的来说,培训目标生成网络(图。1)是

$ $ {J} _ {{\ rm{生成}}}=β\ {J} _ {{\ rm{副词}}}+ \γ{J} _ {{\ rm{池}}}\,$ $
(12)

我们乐团成员的数量k= 4,敌对的减肥β= 6和pool-regularization重量γ= 20。类似于演化网络,我们设置输入长度T0= 9和输出长度T= 20。我们用亚当的优化器34批量大小的16 - 3×10的初始学习速率−5的短时预测编码器,需要美国所有企业提供短时预测解码器和时序鉴别器和培训需要美国所有企业提供生成网络5×105迭代。

转移学习

NowcastNet巧妙降水短时预测的基本模型。大规模数据集将帮助NowcastNet更善于学习物理进化和混沌动力学的降水过程。因此,在国家或地区错综复杂的大气过程,但没有足够的雷达观测,我们使用学习策略转移27,事实上从pre-trained重用知识基础模型。给定一个pre-trained NowcastNet模型,我们使用目标J进化J生成来调整其进化网络通过解耦和生成网络反向传播,这之间的梯度分离J进化J生成。降水背后的物理知识是普遍和可转让的在全世界范围内,我们减少演化网络的学习速率的十分之一,生成网络避免遗忘36的物理知识。我们pre-train NowcastNet模型在大规模数据集和调整小规模数据集与亚当优化器34,但仅限于2×105迭代。

Hyperparameter调优

我们使用CSI的均值附近(CSIN)预测时间所有步骤在雨的16毫米级别h−1,32毫米h−1h和64毫米−1当调优的hyperparameters进化网络。我们计算的标准hyperparameter调优的平均数量,\ \(压裂{{{rm \ {CSIN}}} _ {16} + {{\ rm {CSIN}}} _ {32} + {{\ rm {CSIN}}} _ {64}} {3} \)。调优hyperparameters生成网络时,我们使用两个主要评价指标,CSI邻里和PSD。hyperparameters为每个模型不同,我们首先确保模型的PSD pySTEPS更糟。然后我们使用平均CSI社区标准\ \(压裂{{{rm \ {CSIN}}} _ {16} + {{\ rm {CSIN}}} _ {32} + {{\ rm {CSIN}}} _ {64}} {3} \)确定最终的hyperparameters。

基线

我们描述了四个基线比较研究中使用。有丰富的文学的相关工作,我们进一步讨论它们作为背景的补充信息部分E

DGMR

DGMR是一种先进的降水短时预测方法,气象学家公认的专家。我们真正的复制相同的架构和培训设置裁判中描述。4和可用的模型文件发布https://github.com/deepmind/deepmind-research/tree/master/nowcasting,定量和定性的结果与原始论文报告。我们设置了数量k乐团成员4在训练,NowcastNet一样。

PredRNN-V2

我们认为PredRNN-V2 (ref。13),PredRNN的最新版本37与基础课convolutional-recurrent网络,中国气象局的部署操作重点学科。我们雷达领域切成4×4补丁和补丁的频道维度展开,这有效地平衡成本计算和预测能力。反向安排抽样与指数增加策略被应用于第一5×104迭代。

U-Net

我们使用Ravuri等提出的改进版本。4增加一个剩余结构的每一块香草U-Net30.以及降水强度的损失加权,并预测所有字段在一个向前传递。

pySTEPS

我们使用从裁判pySTEPS实现。9后,可以在缺省设置https://github.com/pySTEPS/pysteps

所有深度学习模型,包括NowcastNet、DGMR PredRNN-V2 U-Net,在美国训练数据集(2016年- 2020年)的亚当优化器与一批16 5×10的大小5迭代和转移到中国数据集2×10的微调5迭代。在评估的所有模型,我们建立一个公平的比较通过使用相同的权重w(x)的加权距离l编写《和同样的采样策略的训练数据。加权方案和采样策略都是取自DGMR4

数据集

两个大规模、高分辨率数据集复合雷达观测实验中使用来自美国和中国。补充信息部分中描述的评价指标B。更代表降水事件的案例研究和定量结果的总体性能可扩展数据无花果。2- - - - - -8和补充信息部分CD

美国数据集

美国的雷达观测数据集由mrm系统26,38收集在美国。雷达复合材料覆盖面积从20°N 55°N南北方向60°和130°W W东西方向。复合材料是3500×7000的空间网格,每个网格的分辨率0.01°。复合材料的缺失值被分配-值,它可以掩盖在评价漠不关心的位置。我们使用雷达观测收集6年时间范围从2016年到2021年,在训练集涵盖了测试集涵盖了2016年- 2020年和2021年。我们遵循的策略用于参考。4这样的雷达观测每个月的第一天的训练集都包含在验证集。权衡计算成本和预测能力,我们将时间分辨率设置为10分钟,缩减雷达领域的空间大小的一半原始的宽度和高度,这将使大多数convective-scale细节。我们雨率限制在128毫米h的价值−1

中国的数据集

中国数据集包括雷达观测收集由中国气象局在中国。雷达复合材料覆盖面积从17°N 53°N 96°E南北方向和东西方向的132°E,报道的中国的中部和东部。复合材料是3584×3584的空间网格,每个网格的分辨率0.01°。类似于美国的数据集,失踪的值替换为负值。我们使用雷达观测收集近2年的时间从2019年9月1日到2021年6月30日。数据从2019年9月1日到2021年3月31日作为训练集,而从2021年4月1日到2021年6月30日作为测试集,我们遵循裁判使用的策略。4这样的雷达观测每个月的第一天的训练集都包含在验证集。值得注意的是,测试期间涵盖了汛期极端降水和暴雨频繁的在中国。我们设置了时间分辨率、空间大小和rain-rate阈值完全相同的美国数据集。

数据准备

我们为每个数据集构造训练集和测试集使用重要性抽样策略4增加的极端降水雷达系列的比率。我们第一批帧系列成更小的时空的大小。对于训练集,我们把系列切成作物空间大小的256×256偏移量的大小和时间270分钟32在垂直和水平方向上。测试集,我们把系列切成作物空间大小的512×512偏移量的大小和时间270分钟32在垂直和水平方向上。然后我们给每个作物接受概率,

$ $ \公关({{\ bf {x}}} _ {{T} _ {0}: T}) = \ mathop{总和\}\ limits_ {T = - {T} _ {0}} ^ {T}{\左\绿色{\ bf {g}} ({{\ bf {x}}} _ {T})正确\ \绿色}_{\ε},{1}+ $ $
(13)

这是雷达领域的总和为所有网格和时间步长作物,然后呢ϵ是一个小的常数。作为在DGMR4,对于训练集,我们组g (x)= 1−ex在每个网格的有效值和g (x在每个网格)= 0缺失值。我们使用分层抽样在训练,首先采样帧系列,然后采样作物系列。评估对极端降水事件的不同模型的预测能力,我们定义g (x)=x为测试集,测试集是在评估提前采样和保持不变。我们的目标是熟练的短时预测极端降水,这种重要性抽样策略偏向与更大比例的极端降水天气事件。

我们也使用uniform-sampling协议,这样所有light-to-heavy降水可以同样的评价。在这个协议,作物在测试集样本一致空间和时间范围。因为均匀采样序列通常有稀缺的沉淀,我们扩大了数据集的大小为美国288000年和120000年中国案件,三倍importance-sampled测试数据集。根据本协议可在定量结果补充无花果。1011

评价

我们执行一个气象学家评估认知评估任务和定量评价使用操作核查措施。

气象学家评估

构建测试子集代表极端降水事件的气象学家评估专家,我们第一次样品一套新的测试包含作物空间大小为512×512详细在前一节中使用相同的策略。这个测试集样本后,我们排名和庄稼的雨率在所有网格率高于阈值的20毫米h−1。这是暴雨的阈值由中国气象局用于操作实践。我们以1200事件为专家气象学家评估子集。因为测试事件较少,我们改变策略,通过网格的比例排名所有事件率高于20毫米h−1,包括极端降水有很高的概率,同时确保时间的多样性。在所有作物在这个测试子集,所有模型作为输入空间大小512×512、384×384和中央区域的字段是放大突出预测对流的细节。

使一个专业、透明和公平的气象学家评估,中国气象局发布了一个公告所有省级气象观测站,邀请高级气象学家参与评估作为志愿者。公告内容,目标和指南的专家评估,特别是澄清的匿名评价结果只用于科研技能测试的但不是气象学家或其他目的。操作上,我们建立一个匿名网站的气象学家评估。每个专家登录网站使用一个自动生成的用户帐户和密码保护执行匿名评价,没有任何模型信息的通知。展示真实的雷达观测后评估,我们过去和未来的视野和匿名模型预测以随机的顺序为每一个事件,而在评估之前,我们只显示了真正的雷达观测。气象学家可以玩视频,在进度条刻意观察云进化或任意停止视频在某个时间步的细致比较所有模型的预测能力和价值。

定量评价

与常用的定量评价指标包括地面真理之间的差异比较和模型预测作物在测试集。每个模型输出未来18帧的降水场9过去帧的雷达观测,而pySTEPS给出四个过去的帧。类似于评估DGMR的协议4,输入空间的大小设置为512×512计算PSD度量和作为计算其他指标的256×256。我们应用central-cropping技术,作物64×64网格方块的中心区域18预测帧,以及相应的地面真理。PSD指标直接计算在512×512年降水字段,而其他指标计算和预测之间的真实数据集。中央种植可以消除边界影响,降低计算成本4。与集成预测方法的能力,包括NowcastNet DGMR pySTEPS,我们设置了号码k乐团成员4计算具体的量化措施。