介绍

SARS-CoV-2于2019年在中国出现,并于2020年3月引发了全球大流行- COVID-19大流行1。为应对这一疾病,世界上许多国家采取了前所未有的减少流动措施,如封锁或宵禁,造成了重大的财政影响。这些措施是合理的,因为人口流动是病毒传播的一个关键因素2,再加上人口密度,这些因素与人与人之间感染性接触的可能性较高有关3.

在其他原因中,几项研究表明呼吸道病毒的传播与气候条件之间存在联系45。流感病毒就是这种情况,绝对湿度对其传播和季节性的作用已得到证实6。呼吸道病毒有几种传播方式,但气溶胶(小颗粒)的空气传播更有可能受到气象条件的影响。然而,涉及这些过程的机制仍然知之甚少,这需要进一步的调查7

关于SARS-CoV-2的爆发,一项开创性的研究8在大流行开始时进行的一项研究警告说,90%的感染发生在温度在3至17°C之间,绝对湿度在4至9克/米之间的地区3.。来自不同国家的其他研究将温度或湿度与COVID-19联系起来。最值得注意的是,研究表明,对于区域平均温度低于10°C的北半球国家,变化为1克/米3.平均绝对湿度每增加1℃,基本繁殖数R0就会变化0.15个单位;每增加1℃,R0就会降低0.16个单位9

在本文中,建议使用PREDICT服务公司最近开发的一项指标(称为IPTCC)进行统计调查,IPTCC是PREDICT的covid -气候传播指数的法语首字母缩写10。巴斯德研究所(Pasteur Institute)特别使用该指数来完善他们的模型,并将旨在更好地解释流行病学指数演变的环境因素纳入其中。此外,将IPTCC整合到统计模型(如多元线性回归模型和广义可加模型)中,将住院人数的预测与观测结果之间的误差分别校正了22%和13%11

2020年,病毒在法国大陆的传播在空间和时间上都是不规则的。第一波疫情在2020年3月至4月期间影响了法国,尤其是巴黎地区和法国东北部。污染数量在春末急剧下降,在夏季保持相当低的水平。然后,第二波浪潮在2020年10月至11月期间同样影响了这个国家。自2020年12月以来,疫情进入平稳期,每日新增病例较多。

从气象的角度来看,法国暴露在几个气候动力学中。西部海岸线属于海洋性气候,全年气温温和,雨量充沛。该国东北部为半大陆性气候,夏热冬冷。地中海气候的特点是冬季温和,夏季温暖,降雨少,这是不规律的。

我们利用这种地理多样性,对气候条件对SARS-CoV-2引起的住院和死亡进行了因果分析。我们的方法是基于向量自回归(VAR)模型的估计,遵循经济学的既定实践12在美国,它们被用来量化经济体对外生结构性冲击的反应;它们也用于生命科学。1314),并被发现特别有助于分析SARS-CoV-2的动态(1516).VAR模型可以很容易地用于量化气候条件对流行病学变量的影响,因为前者显然是后者的外生因素。

我们的分析是在区域一级进行的,目的是利用各区域的异质性(在气候条件和病毒流行方面),并获得不受卫生措施影响的估计。在本报告所述期间,法国大陆所有地区政府实施的流动限制基本上是一样的。具体而言,2020年3月17日至2020年5月11日实行严格的全国封锁,2020年10月30日至2020年12月15日实行轻度封锁(学校保持开放)。

方法

数据

我们考虑了54个NUTS3行政区域(命名为划分为期42周(从2020年3月23日到2021年1月10日)。我们没有考虑所有现有的区域,而只考虑了可以计算IPTCC的54个区域。为了评估气候条件对大流行的影响,我们使用了所考虑的54个行政区中每周因SARS-CoV-2而入院和死亡的人数。这些数据是官方的,可以在www.data.gouv.fr。在此期间,由于SARS-CoV-2导致的住院和死亡人数得到了一致的测量,因此比报告感染数量的系列更可靠,因为后者高度依赖于检测的可用性和人群接受检测的意愿。每日数据自2020年3月19日起可用,但我们选择使用每周频率,以避免周末报告较少引起的季节性影响。

气象数据来自法国的63个气象站。这些站点均匀地分布在法国大陆,选择它们是为了更好地代表该国气候的多样性。该数据集提供了空气温度(以°C测量)和相对湿度(以%测量)的日平均值;这些数值是每日最高和最低温度和相对湿度的平均值。有了它们,就很容易计算出每个站点的日绝对湿度,以g/m为单位3.,使用克劳修斯-克拉珀龙方程8

为了分析气候条件与病毒传播之间的潜在关系,建立了IPTCC,根据气候条件描述病毒传播的可能性。后10, IPTCC是绝对湿度(AH)、相对湿度(RH)和温度(T)的函数,其表达式为:

$ $ IPTCC = 100 * e ^{{- \压裂{1}{2}\离开[{\压裂{{\离开({T - 7.5} \右)^{2}}}{196}+ \压裂{{\离开({RH - 75} \右)^{2}}}{625}+ \压裂{{\离开({AH - 6} \右)^{2}}}{2.89}}\右]}}。$ $

因此,当温度达到7.5℃,相对湿度达到75%时,IPTCC最大。自2020年1月1日起,所有气象站每天都可以使用IPTCC。然后,对于考虑的54个地区中的每一个,我们建立了一个每周指标,计算为每日IPTCC的平均值。IPTCC通过2D和3D表示的可视化在补充材料中提供(图2)。A1A2).

作为初步步骤,可以绘制出所考虑的时间段内变量的演变。54个地区的数据详见补充资料(图1)。A3).总结一下,图。1每周报告住院和死亡人数(即54个区域的总数)和每周IPTCC(54个区域的平均值)。这三个系列之间的相关性非常显著(见表1)A2对于系数)。最值得注意的是,住院和死亡的高峰与IPTCC平均较高的时期相对应。相反,在整个春季和夏季,住院率、死亡率和IPTCC都很低。我们还注意到,IPTCC比流行病学系列更不稳定。最后,IPTCC的发展似乎先于住院和死亡,这可能是由于污染、潜伏期和疾病可能恶化之间的时间。

图1
图1

2020年3月23日至2021年1月10日住院总人数和死亡人数与平均IPTCC时间序列的比较

为了超越第一个图形分析并调查气候条件如何影响SARS-CoV-2的传播和严重程度,我们开发了一个时间序列分析。这分两步完成。首先,我们证明了IPTCC与住院和死亡之间的因果关系,然后我们评估了后者对IPTCC增加的反应。

格兰杰因果关系

我们首先探讨了气候条件是否会导致SARS-CoV-2的住院和死亡,即考虑到过去的住院和死亡信息,气候条件的过去值是否包含有助于预测住院或死亡的信息。

为了检验气候条件与住院和死亡之间的格兰杰因果关系,我们使用了2020年3月23日至2021年1月10日54个地区的每周数据,考虑了以下面板动态模型。

数组$ $ \开始{}{* c {20}} {y_{它}= \ mathop \总和\ limits_ {s = 1} ^ {p} \ alpha_{年代}y_{它年代}+ \ mathop \总和\ limits_ {s = 1} ^ {p} \ beta_{年代}cl_{它年代}+ \ mu_{我}+ \ delta_{我}.t + \ eta_ {t} + \ varepsilon_{},我= 1,N \ \ ldots;和\;t = 1, \\ \\ end{array}$$
(1)

在哪里我\ \ ()\ \ (t)分别为区域和时间指标;\ (y_{它}\ \左\ {{hosp_ {}, death_{它}}\右\}\)它\ (hosp_ {} \)它\ (death_ {} \)分别表示1加上住院人数和死亡人数的对数;它\ (cl_ {} \)为IPTCC指数;\ (\ mu_{我}\)是区域性的固定效应,\ (\ delta_{我}t \)区域特定的时间(线性)趋势,和\ (\ eta_ {t} \)常见的是国家时间(周),具体影响包括季节影响。

值得注意的是,采用住院和死亡的对数可以通过区域固定效应\ (u_{我}\),以解释区域的异质性,如面积、人口或密度,这些异质性在所考虑的时期内大致稳定。此外,还包括了特定区域的时间趋势\ (\ delta_{我}.t \)使用日志规范可以捕获疾病传播的潜在指数增长,这可能是特定区域的。最后,使用\ (\ eta_ {t} \)可考虑到疾病跨区域传播的国家相互依赖性(包括任何季节性影响)。初步诊断(小组单位根检验)拒绝了去趋势变量的单位根零假设(具有特定区域的线性趋势)。然后,在控制区域异质性(通过引入区域特定效应和区域特定时间趋势)和跨区域相互依赖性(通过引入周特定效应)的同时,我们考虑了水平或对数水平上的变量。

\ ({\ uptheta} = \离开({\ alpha_ {1}, \ ldots \ alpha_ {p} \ beta_ {1}, \ ldots \ beta_ {p}} \右)^ {\ '}\)为待估计截面单元上的参数向量。给定跨区域维度的大小\ (N \)时间维度\ \ (T)在面板数据(\(n = 54\)\(t = 42\)),以处理短t动态面板数据偏差或所谓的尼克尔偏差17,我们使用了偏差校正固定效应估计器18,这是合适的\(0 < \lim N/T < \infty\),这里的情况也是如此(见19).该技术包括去除最小二乘虚拟变量(LSDV)或固定效应估计量(具有区域特定的时间趋势和时间特定的效应)的渐近偏差\ \ uptheta \ ()。的LSDV估计量\ \ uptheta \ ()由最小二乘(OLS)回归给出\ \(波浪号{y} _{它}\)\(\波浪号{y} _ {- 1}, \ ldots \波浪号{y} _{——p}, \ widetilde {cl} _ {- 1}, \ ldots \ widetilde {cl} _{——p} \)在哪里\ \(波浪号{x} _{它}\)是的变换\(间的{}\)在去除区域特定的影响和趋势以及每周的全国平均水平之后(这种转换对应于包括\ (\ mu_{我}\)\(\delta_{i} \cdot t\),\ (\ eta_ {t} \)).

基于贝叶斯信息准则(BIC)和汉南-奎因信息准则(HQC),设定了滞后长度\ (p \)到3,使误差不存在序列相关性。取大于3的滞后长度不会改变我们的发现。

在Eq. (1),无格兰杰因果关系的零假设(它\ (cl_ {} \))至住院或死亡(\(y_{it} = hosp_{it} \;{\text{or}}\;death_ {}) \)\ (H_ {0}: \ beta_ {1} = \ beta_ {2} = \ ldots = \ beta_ p {} \)。无格兰杰因果关系的原假设可以表示为\(R{\uptheta} = 0 {p \乘以1}\)在哪里\ (R \)是已知的\(\左({p \乘以2p} \右)\)矩阵\(R = \left[{0:I_{p}} \right]\)。检验统计量是Wald统计量,由\ (W = \帽子{\θ}^ {\ '}R ^{\ '} \离开[{\帽子{\σ}^ {2}R \离开(X ^ {X}{\ '} \右)^ {- 1}R ^{\ '}} \右]^ {- 1}R \帽子θ}{\ \)在哪里\ \ (X)是一个\ \(左({N \左({T - p} \) \ * 2 p} \) \)回归量矩阵\(\波浪号{y} _ {- 1}, \ ldots \波浪号{y} _{——p}, \ widetilde {cl} _ {- 1}, \ ldots \ widetilde {cl} _{——p} \)列和{\ \(\帽子σ}^ {2}\)为残差的估计方差。在零假设下\ (W \)遵循自由度等于的卡方分布\ (p \),即与滞后长度相对应的待测试约束的数量。

VAR模型

为了分析流行病学变量对IPTCC变化的动态响应,我们估计了一个面板向量自回归(VAR)模型,其中IPTCC (\ (cl \))被认为是外源性的。可以写成:

数组$ $ \开始{}{* c {20}} {Z_{它}= \ mathop \总和\ limits_ {s = 1} ^ {p}现代{年代}Z_{它年代}+ \ mathop \总和\ limits_ {s = 0} ^ {p} b_{年代}cl_{它年代}+ u_{我}+ d_ f {t}{我}.t + + v_{},我= 1,N \ \ ldots;和\;t = 1, \ldots, t} \\ \end{array}$$
(2)

在哪里\ (Z_{它}= \离开({hosp_ {}, death_{它}}\右)^ {\ '}\)内生变量的二维向量包括1的对数加上住院和死亡,在哪里\(现代{年代}\)\(\左({2 \乘以2}\右)\)相关系数的矩阵它\ (Z_ {} \)\ (b_{年代}\)\(\左({2 \乘以1}\右)\)关联的矩阵\(cl_{it - s}\)\ (u_{我}= \离开({u_{我}^ {1},u_{我}^{2}}\右)^ {\ '}\)是区域固定效应的矢量;\ (d_{我}.t = \离开({d_{我}^ {1},d_{我}^{2}}\右)^ {\ '}.t \)表示区域特定时间(线性)趋势,f {t} = \ \(左({f {t} ^ {1}, f {t} ^ {2}} \) \)是普通时间(周)特定效果的矢量;\ (v_{它}= \离开({v_{它}^ {1},v_{它}^{2}}\右)^ {\ '}\)一个二维的误差向量满足吗\(E\left({v_{it}} \right) = 0\)\ \ (E左({v_{它}v_{是}^{^{\ '}}}\右)= \ω。1 \左\ {{t = s} \右\}\)对所有\ \ (t)\ (\)

如上所述,初步诊断(面板单位根检验)拒绝了去趋势变量的单位根零假设(具有特定区域的线性趋势)。然后,我们的VAR在控制区域异质性(通过引入区域特定效应和区域特定时间趋势)和跨区域相互依赖性(通过引入周特定效应)的同时,考虑级别或日志级别的变量。此外,模型通过修正偏置的固定效应估计器进行估计18,和滞后长度\ (p \)根据Bayesian信息准则(BIC)和Hannan-Quinn信息准则(HQC)将其设为3。使用大于3的滞后长度不会改变我们的发现。

在估计了模型(2)之后,我们计算了内源性变量(住院和死亡)对(外源性)IPTCC增加的响应,以及死亡对住院增加的响应。住院和死亡(内生变量)对气候条件(外生变量)的反应是乘数分析的一部分;因此,没有必要识别内生变量的结构性冲击(参见20.10.6节)。然而,为了确定死亡对住院治疗的反应,有必要确定结构性冲击\ (\ eta_{它}\)这两个内生变量的关系如下:\(\eta_{it} = A_{0} v_{it}\)在哪里\(现代{0}\)\(2 \乘以2\)矩阵满足\(E(\eta_{it} \eta_{it}^{^{\prime}}) = I_{2}\)\(A_{0} A_{0}^{^{\prime}} = \Omega\)。我们确定了\(现代{0}\)基于设置的Cholesky分解\(现代{0}\)的唯一下三角形Cholesky因子ω\ (\ \)。这种识别依赖于一个合理的假设,即住院治疗可以同时影响死亡,而死亡可能只会对住院治疗产生滞后影响。

结果

IPTCC与流行病学变量之间的因果关系

气候条件与SARS-CoV-2引起的住院和死亡之间的格兰杰非因果关系结果见表1。在5%的显著性水平上,我们不能接受气候条件与住院或死亡之间没有格兰杰因果关系的零假设。换句话说,即使考虑到过去的住院和死亡信息,过去关于气候条件的信息也有助于预测住院和死亡情况。

表1从IPTCC到住院和死亡的格兰杰因果关系。

尽管上面进行的格兰杰因果分析表明,IPTCC的过去值如何有助于预测住院和死亡,但它没有提供住院和死亡对IPTCC变化的反应的任何评估。这是用VAR模型完成的。

对IPTCC变化的流行病学反应的估计

我们考虑IPTCC增加10个点,这一增加被理解为相对于所考虑的期间的IPTCC平均值(即25.5)。人们应该注意到,10点的增加对应于相当小的温度和湿度变化。例如,在塞纳-海区,IPTCC从42上升到52旅行2020年4月6日至4月13日;这种变化是由于温度从13°C下降到11°C,相对湿度从73%增加到75%。增幅最大的是芬兰(76.9)旅行2020年5月4日至5月11日期间,气温从16摄氏度降至10摄氏度,相对湿度从83%降至68%。降幅最大(- 66.9)的是hsamrault旅行在2020年12月7日至12月14日期间,气温从6摄氏度上升到12摄氏度,相对湿度从76%上升到91%。

住院和死亡对IPTCC增加10个点的动态响应显示在图中。2。上图表示IPTCC对住院的估计影响。第0周是增加发生的那一周。我们观察到,住院治疗的反应是延迟的,但相当持久:从增加后一周到至少10周后,它都是显著阳性的。就量级而言,我们估计住院率在IPTCC增加一周后增加2.9% (90% CI 0.7-5.0),在接下来的两周内增加4.1% (90% CI 2.1-6.4)和4.4% (90% CI 2.5-6.3)。在十周内,累积效应估计达到20.1%。与他们在这段时间内的平均值(即每周和地区147人)相比,这代表了30人。请注意,为了评估例如将IPTCC增加50点使其超过75点的影响,我们的估计应该简单地乘以5。因此,对住院的累积影响预计将达到100%。

图2
图2

住院和死亡对IPTCC冲击的动态反应。请注意实线给出估计的脉冲响应。虚线给出了蒙特卡罗在5000次重复中生成的90%置信区间。IPTCC的增加幅度设定为增加10个百分点。住院人数的增幅设定为1%。回答是住院和死亡人数的百分比变化。

图中面板。2表示IPTCC同样增加10个百分点对死亡的估计影响。这种影响也是积极的,但进一步延迟,因为它在IPTCC增加后的第二周成为积极的。在那一周,我们估计死亡人数增加了3.7% (90% CI 1.6-5.8)。第2 ~第10周累积效应达到15.8%。与他们在这段时间内的平均值(即每周和地区25个人)相比,这代表了4个人。住院和死亡之间的联系在图的底部面板进一步调查。2,这代表死亡人数对住院人数增加1%的反应。我们观察到立即的反应,幅度为0.21%,第二周增长到0.28%,然后下降。这些最后的评估与现有的评估大致一致(21等);它们不能立即进行比较,因为我们考虑到住院治疗对其自身变化的反应。系列中持久性的存在解释了为什么我们的评价略高。

灵敏度和稳健性分析

通过分析替代气候条件下的动态变化,并考虑环境污染作为可能的干扰变量,评估了我们研究结果的敏感性和稳健性。

首先,在捕捉气候对流行病学动态的影响方面,气候条件的替代指标似乎不如IPTCC有效。我们用两个替代指标举例说明了这一点。最初,我们使用使用温度和湿度异常目标值计算的“假”IPTCC指数。当温度达到30°C,相对湿度达到20%时,“假”IPTCC达到100。我们得出,住院治疗不再对该指标有显著反应(见图2)。A4见补充资料)。然后,我们用归一化温度指数代替IPTCC,计算为\ (T_ {n} = 100识别\ cdot e ^{{- \离开({T - 7.5} \右)}}\),因此从湿度变量中抽象出来。我们得到,三周后,住院治疗的反应变得显著,但效果不太清楚,幅度也不太重要(见图2)。A5见补充资料)。这证实,虽然温度和湿度部分相关,但当它们结合成一个单一指标来评估气候对流行病学变量的影响时,它们都是有用的。

其次,重要的是调查我们的结果是否会被一些遗漏的变量所偏倚。特别是环境污染,其对呼吸系统疾病的影响是众所周知的(见例如:22),最近已被证明与COVID-19的流行有关(232425).因此,我们估计了模型的扩展版本,以便考虑到环境污染的演变。更具体地说,我们收集了大气颗粒物(PM)浓度的周平均值10和点2.5),二氧化氮(NO2)和臭氧(O3.)作为我们所考虑的区域的子样本。我们发现,在5%的显著性水平下,我们仍然不能接受气候条件与住院或死亡之间没有格兰杰因果关系的原假设(表1)A3见补充资料)。此外,住院和死亡对IPTCC增加10个点的动态响应在质量上与图中显示的相似。2(无花果。A6见补充资料)。因此,我们的结果对模型中包含的环境污染变量具有鲁棒性。有趣的是,我们还得出,空气污染与住院或死亡之间没有格兰杰因果关系的零假设不能被拒绝,但在短期内,大气颗粒物的浓度对住院和死亡有影响。

讨论

通过测试IPTCC对法国SARS-CoV-2引起的住院率和死亡人数的统计影响,本研究确认了温度和湿度在SARS-CoV-2空气传播中的潜在作用,强调这两个变量的特定组合为疾病的传播创造了有利条件:当温度为7.5°C和相对湿度为75%时,住院率和死亡人数增加。与早期的研究相比,它提供了强有力的因果证据,并对气候因素对该病动态的影响提供了新的量化方法。最值得注意的是,它描述了气候条件与住院和死亡之间的时间延迟,并将空气污染指标作为控制措施。

这项研究有几个局限性,值得注意的是它是在法国大陆进行的,需要在其他国家复制,以确保IPTCC最大的基准组合(温度为7.5°C,相对湿度为75%)是相同的。此外,尽管该模型使用的是区域数据,但其结果并不具有区域特异性。这应该被理解为法国普通地区的反应。需要更多的数据才能确定区域差异的特征。此外,该研究涵盖了从2020年3月开始到2021年1月结束的时期。因此,它没有考虑到最近的病毒变种,也没有考虑到疫苗接种运动。更一般地说,与公民的行为和对卫生建议的尊重、卫生条件、获得医疗服务的机会以及卫生服务的质量和资源有关的人为因素显然对COVID-19的传播和其他指标产生重要影响。因此,不应断章取义,它不是世界面临的危机的唯一条件或解释。天气不是灵丹妙药。

尽管如此,将气象成分纳入总体分析可以更好地监测和预测大流行病的动态,这里住院人数的变化就是例证。由于IPTCC时间序列与住院之间存在延迟,我们的指数可以帮助提前2至3周预测卫生系统的压力。这可以实现,并不断更新非常容易使用的温度和湿度预报提供了法国站。当地或地区天气的变化可以帮助政府预测未来的流行病浪潮,并做出决策和沟通,以保护人口免受SARS-CoV-2或其他通过空气传播的呼吸系统疾病的侵害。