介绍

COVID-19流行病的爆发迫使全球政府卫生保健干预措施。导致一个重大争议在公众中面具的使用1,2,3。最初,人们认为SARS-CoV-2的主要传播方式是通过咳嗽或接触表面。广泛的个人防护设备,卫生工作者短缺导致初始建议一般人不戴口罩。虽然没有现存的研究表明口罩减少人类传播SARS-CoV-2,口罩减少病毒传染其他的冠状病毒4和传播SARS-CoV-2动物模型5。同时,布口罩过滤SARS-CoV-26,主要是如果他们穿的受感染的个人通过防止液滴的雾化7

疾病控制和预防中心(CDC)改变了方针4月3日,2020年,推荐广泛使用的面具8。根据疾病防治中心的说法,其政策变化背后的基本原理是增加的证据表明无症状发生前症状和人感染9,10,11,12,13,14这有许多未被发现的情况下15。同样,欧洲疾病预防与控制中心(ECDC)建议使用口罩16。不过,它指出,“现在还不知道多少面具在社区的使用有助于减少传播除了其他对策”17。6月5日,世界卫生组织(世卫组织)改变其指导方针和建议政府鼓励公众戴着面具在特定情况下像杂货店18。12月1日,世卫组织更新指导面具和包括气溶胶传播的一种手段19。在本文中,我们表明,政策变化对面具的疾病预防控制中心(和地方政府)的阳性病例数下降在美国康涅狄格(CT),马萨诸塞州(MA)、纽约(纽约州),罗德岛(RI)和弗吉尼亚(VA)。

评估因果关系,我们需要评估干预的两个分支20.:一个的干预确实发生了,一个没有。这样做的黄金标准是双盲随机对照试验(RCT)模式。虽然可能21,相关的不规范在公共卫生流行病学干预。即使实现,没有所谓的“安慰剂”旅行限制或双盲关闭学校。因为安慰剂或双盲试验是不可能的,有一个间接治疗和结果之间的因果路径22,23。例如,人们在邮政编码与开放的学校可能会更注意自己的卫生,因为他们知道他们是在更高的风险比人们在学校的邮政编码都关门了。当第二个分支的干预并没有发生,它被称为反事实的(“与事实相反)。一个选项来测量干预的直接影响,我们在这项工作中使用的,是估计或模拟反事实的分支24,25

在这里,我们提出一个框架来分析数据从COVID-19流行可以模拟特定NPI不会发生反事实的场景。在这个框架中,我们使用积极的可能性测试作为因变量,而不是阳性的数量26或死亡27。我们激励一个线性方程使用Susceptible-Infected-Recovered这个因变量的进化(先生)模型28,29日。我们表明,我们可以计算出平均感染的人数每天从一个积极的情况下,一个参数称为瞬时繁殖数量(\ (R_t \))30.。最后,我们开展一个套索31日回归健康数据,获得分段线性拟合的对数与最小数量的优惠(见补充图。S4在线)。这个回归发现时候干预开始,让我们来模拟替代场景这些干预没有发生和评估他们的净影响。

结果

每日的病例数和测试高度变量(无花果。1)。为了减少这种可变性,我们计算log-odds,阳性的数量的对数消极的数量。这样做,揭示了一个分段线性模式,我们配合使用套索回归(图。2)。这些回归显示三个断点log-odds在纽约,两个在CT,妈,MI, RI, VA。我们应该强调这样一个事实,这些优惠并不是一个输入的用户。相反,这是应用套索正则化的结果。这些changepoints npi发生后不同。一旦到位,npi仍然有效期间,我们进行了分析。第一个改变CT和马,第一次和第二次在纽约,是由于流动性限制(关闭学校,禁止大规模集会,限制不必要的劳动力,和全职订单)。在这些州,最后打破CDC面具改变其指导方针后发生。在MI、RI和弗吉尼亚州,呆在家里订单和CDC建议戴上口罩发生更近,因此很难理清他们的效应。然而,MI政府只执行面具的使用在封闭的区域(如杂货店),和弗吉尼亚州政府从来没有推荐使用口罩。我们假设缺乏本地订单关联与当地的疾病控制与预防中心的指导意见中,这解释了为什么我们看不到掩蔽效应在MI和弗吉尼亚州。

图1
图1

每天的新病例数和测试数据集中每个州。

图2
图2

积极的可能性测试在对数刻度。模型的假设下,这个变量应该是分段线性的。蓝色的点是数据点。橙线退化模型和橙色色调是95%可信区间。

我们使用的斜坡回归计算\ (R_t \)。在无花果。3,我们将展示\ (R_t \)作为时间的函数,在表12我们显示的值\ (R_t \)它改变的日期,和npi的日期。纽约的阴谋,在无花果。3显示,\ (R_t \)从2.1下降到1.6,然后\ \ (0.72)3月30日,8天后关闭所有不必要的业务。带他们在一起,这将减少65%\ (R_t \)由于流动的限制。还有第三个下降\ \ (0.72)\ \ (0.44)4月14日,11天后疾控中心改变了他们的指导方针和建议戴面具,纽约和2天后执行使用公共雇员的面具。在CT,全职订单减少的价值\ (R_t \)通过\ \ (51 \ %)。此外,新的疾病预防控制中心建议在面具后,它下降了\ \ (40 \ %)。值得注意的是,在马后,命令呆在家里\ (R_t \)值从1.9降至1.1,仍高于1。只有在戴着面具的推荐它降至0.66,低于1。正如我们已经提到的,我们看不到面具在心肌梗死或VA的影响,我们把这种现象归因于缺乏当地合规。在MI,政府只执行在封闭的区域,使用口罩和弗吉尼亚州政府从未统治面具的使用。RI的数据难以解释,因为全职订单和面具的指导方针发生及时关闭,并在4月的数据是不可靠的(每天少于500测试)。尽管如此,有一个效果的疾病控制与预防中心的指导意见中,从地方政府做面具强制性的。

图3
图3

\ (R_t \)作为时间的函数。冲竖线表示不同的政府干预。一旦到位,每个干预整个呈现期间仍然有效。橙色线表示流动性限制订单比如关闭酒吧、健身房、电影院、学校,禁止非基本工作。CDC的黑线显示时刻更新它的指导方针,建议戴口罩。当地的州的绿线显示时刻改变了他们的指导方针面具。纽约的面具和RI强制使用某些工作第一,后来他们在公众面具戴着政策执行。马和CT执行由公众使用口罩。MI只执行使用口罩在封闭的公共场所,如杂货店。弗吉尼亚州从不强迫面具的使用。

表1的值\ (R_t \)为每个数据集和时间\ (R_t \)改变。
表2事件由国家和日期。

最后,sparsifying框架的一个优势是,我们可以通过删除断点模拟反事实的场景。然后,退化线会继续在前面的斜率。公众戴口罩的情况下。从图所示。4我们观察到4月14日在纽约,\ (R_t \)\ \ (0.72)\ \ (0.44)。我们解释,这种干预反事实的是,如果公众没有使用面具,\ (R_t \)会呆在\ \ (0.72),或者在因果推论行话(口罩)。图4(绿线)显示,删除干预会导致一个更加漫长的减少的曲线。现在,我们可以用积极的反事实的赔率来计算反事实的数量和比较它与阳性病例的实际数量做这个产量,4月14日和5月15日之间,戴着面具的影响减少感染的数量由77000例(\ \ (95 \ %)CI 65000 - 89000),在纽约。同样,使用口罩阳性病例的数量减少了83000例(\ \ (95 \ %)CI 80000 - 87000)在4月13日至5月19日和36000例(\ \ (95 \ %)CI 33000 - 40000年)4月14日至5月17日的CT。

图4
图4

实际的和反事实的场景。蓝色的点是数据点。橙色线显示了退化模型,橙色的色调是95%可信区间。绿线显示场景,面具的反事实的可能性是不推荐;在因果推论术语,(口罩);和绿色阴影区域是95%可信区间。

讨论

总之,我们发现口罩减少病毒的传播在CT,妈,和纽约。在这些州,我们的计算表明,干预减少了\ (R_t \)40%,我们估计掩蔽预防200000例(\ \ (95 \ %)CI 190000 - 210000年)从他们在年底前采用全职订单(见表3)。这些结果符合最近发表的结果Mitze等人在德国发现同样的效果32。同时,我们估计,仅在纽约市,面具的案件数量减少了29000 (\ \ (95 \ %)CI 25000 - 34000年)4月17日至5月9日。这个数字低于估计的张等人估计减少66000例同期在纽约市33。我们相信这种差异可以通过指出占张等人没有考虑增加测试期间全职秩序,导致更高的差异屏蔽秩序此时测试后更稳定。

表3的变化\ (R_t \)由于每种类型的npi。

我们提出的框架,是数据驱动的,因此它依赖于只有少数假设与其他方法相比,例如,反事实的分析依赖于一个假设:log-odds分段线性(见情商。6)不需要承担任何先生的假设模型。基于拟合优度,我们相信,这一假设适用于本文提供的数据(见图。2和补充表S2在线)。我们还假设的影响不同的npi是独立的,在对数刻度。例如,我们假设戴口罩减少的价值\ (R_t \)同样的因素,是否学校是开放的。

应该注意的是,计算\ (R_t \)测试代表的人口。例如,\ (R_t \)会偏向于弱势群体中如果这些测试比其他人更多。由于社交网络的结构,这可能是不同的\ (R_t \)人口的整体。这个信息应该考虑来解释我们的结果基础上,根据实际情况。

把框架的测试,我们将方法应用到合成数据,我们发现它能找到相应的断点和斜坡(见“补充部分模拟”,补充图。S5和表S4在线)。然而,当没有可靠的数据-测试结果,我们的框架未能适应数据(见补充图。S2,S3和表S2、在线)。更详细的数据将在未来需要建立更好的模型。理想情况下,数据将组织以个案的方式,它将包含信息示例准则。从根本上说,这些信息应该用于负面测试结果。

总的来说,我们发现,面具减少SARS-CoV-2并防止新的感染的传播。我们希望我们的发现将说服当地政府和政府间机构强烈推荐使用口罩,防止SARS-CoV-2的传播。我们到达这个结论通过合并两个不同的传统:因果推理和正规化的回归。我们相信,这些技术的结合将是富有成效的原因和影响的其他上下文是稀疏的。

方法

数据

我们收集的数据从国家提供原始数据测试和阳性病例的数量每一天。我们发现16个州提供这些信息。他们中的一些人提供了一个抽象的协议接口(API)。其他文件的信息服务。许多国家提供了一个视觉指示板信息测试,但如果他们不提供原始数据,我们没有使用它。至少有一个项目,从所有的州收集测试数据:https://covidtracking.com/。该聚合器构建其数据库基于快照的仪表板发表的状态。这些快照中的信息是平均一天三到四次。这一过程使积累了数量的测试和积极可靠,但不是他们的日常变化。这就是为什么我们没有使用信息从这个聚合器,我们只使用直接从官方信息来源。我们提供每个数据集在表的链接S1

在主要的文本,我们最高的六个数据集显示查询结果\ (R ^ 2 \)。展示框架的鲁棒性和局限性,我们展示的所有状态的分析,我们发现数据每日补充无花果的病例数和测试。S1- - - - - -S3、表S2,S3,在线。在主要的文本中,我们限制NYS的分析时间,马,CT结束他们的全职秩序。显示框架的鲁棒性,在“补充信息”,我们显示结果的方法应用到一个更大的时间间隔。以来,由于积压,一些州有一个延迟报告约1周,我们包含了数据,直到最后一天我们发现可靠的数据。

概率作为因变量

我们可以看到在无花果。1每日阳性的数量,\ \ (P !ositive_t \),在同步振荡测试。为了克服这种噪音的来源,我们建议使用积极的可能性测试:

$ ${对齐}O \ \开始!dds_t = \压裂{P \ !ositive_t} {N \ !egative_t} \{对齐}$ $

在哪里\ (N \ !egative_t \)是负面测试的数量t

我们显示阳性的数量和测试的数量为每个数据集在无花果。1

我们展示的进化的几率在无花果。2。噪音由于变异测试的数量减少,和一个趋势出现。

的演变

正如先前所显示的30.先生,在模型假设,在某一天新感染者的数量,\ (k_t \)可以近似为:

$ $ \{对齐}开始k_t = k_ {t - 1} e ^ {(R_ {t - 1} 1)伽马}\ \{对齐}$ $

在哪里\ (R_t \)瞬时繁殖是几号30.,\ \(γ^ {1}\)平均传染期吗29日估计为7.5天(\ \ (95 \ %)可信区间5.3 -19)根据李et al。34(同意Bi et al。35报告,但高于Du et al。36)。

因为我们没有访问的感染者总数,但只对测试的人口,我们必须使用一些关于人口的统计假设。如果我们假设被测试的人是一个随机样本的人口与COVID-19-like症状,我们可以状态:

$ $ \ P{对齐}\开始!ositive_t = P_t(我|症状)P_t(症状)Nf_t \{对齐}$ $
(1)

在哪里\ (P_t(我|症状)\)病人为正的概率是SARS-CoV-2鉴于她是有症状的,\ (P_t(症状)\)的概率是有COVID-19-like症状,N是总数,\ (f_t \)患者症状的分数,选择进行测试(这个数字可以是不同的每一天,例如,如果可用测试的数量变化)。类似的:

$ ${对齐}N \ \开始!egative_t = P_t(不是我|症状)P_t(症状)Nf_t \{对齐}$ $
(2)

在哪里\ (P_t(不是我|症状)\)的概率是一个病人被SARS-CoV-2负给他COVID-19-like症状。

现在,如果我们假设\ (P_t(症状|我)\)是恒定的,我们可以用贝叶斯定理表明:

$ $ \{对齐}P_t开始(我|症状)P_t(症状)\ propto P_t (I) = \压裂{k_t} {N} \{对齐}$ $

然后:

$ $ \{对齐}P_t开始(我|症状)P_t(症状)\ propto k_t \{对齐}$ $
(3)

最后,如果我们假设\ (P_t(不是我|症状)P_t(症状)\)是不变的:

$ ${对齐}O \ \开始!dds_t = O \ !dds_ {t - 1} e ^ {(R_ {t - 1} 1)伽马}\ \{对齐}$ $
(4)

我们使用四套假说。首先,我们使用先生的假设模型。其次,我们使用测试人口是一个随机样本的人口COVID-19-like症状(方程式。12)。这个假设并不持有,例如,如果测试某人的基础,她接触的确诊病例。如果发生这种情况,它遵循我们的计算\ (R_t \)会偏向over-sampled人口。例如,它可能计算\ (R_t \)更代表一个老年人比年轻人,鉴于前者比后者更经常测试。第三,我们假设\ (P_t(不是我|症状)P_t(症状)\)是恒定的。这一假说的人数相当于说COVID-19-like症状但没有SARS-CoV-2(例如,患有流感)是恒定的。鉴于我们计算\ (R_t \)在跨周时期,它足以承担\ (P_t(不是我|症状)P_t(症状)\)常在这段时间,还是其变化率是微不足道的变化率与SARS-CoV-2症状的人数。第四,我们使用,症状出现瞬间,测试执行和处理在同一天(Eq。3)。这最后的假设是不正确的,这就是为什么,在我们的分析中,干预措施的影响显示延迟发病8至11天。

线性化

我们写情商。4)的线性函数的变化率\ (R_t \)。定义

$ $ \{对齐}开始b_t = e ^ {(R_ {t} 1)伽马}\ \{对齐}$ $
(5)

我们可以把情商。4):

$ ${对齐}O \ \开始!dds_t = b_ {t - 1} * \啊!dds_ {t - 1} \{对齐}$ $
(6)

现在,而不是使用\ (b_t \)参数估计我们分解\ (b_t \)如下:

$ ${对齐}b_t = \ \开始刺激_ {i = 0} ^ {t} ai \{对齐}$ $
(7)

\ \ (a_i)s代表变量的变化率\ (b_t \)在对数刻度。接下来,我们更换(7)(6):

$ $ \{对齐}开始日志(O \ !dds_t) = \总和_ {i = 1} ^{马克斯(t - 1, 1)}(我)日志(ai) +日志(O \ !dds_{1}) \{对齐}$ $
(8)

我们可以写(8)作为一个线性问题以下定义:

$ $ y \ \{对齐}开始,X = \ &{} \β+ \β_0 \{对齐}$ $
(9)
$ ${对齐}y_t \ \开始,= \ &日志({}\啊!dds_t) \{对齐}$ $
(10)
$ $ \{对齐}开始间{t,我}\,= \ &{}马克斯(我,0)\{对齐}$ $
(11)
$ ${对齐}\β_t \ \开始,= \ &{}日志(现代{t}) \{对齐}$ $
(12)

重要的是,爵士假设只需要画出连接\ (R_t \)(Eq。5)。然而,情商。8)可能即使先生假设不发挥作用。会变化的解释参数。

套索回归和特征选择

因为在情商。9),我们有尽可能多的解释变量的样本,我们假设的变化一个只是由于自上而下的干预我们使用套索回归适合数据31日。这个回归最小化损失函数:

$ $ \{对齐}开始犯错= \压裂{1}{n} \ _ {t = 1} ^ n \离开(y_t -β\ _0 - \总和_ {i = 1} ^ {n} \β_i间{t,我}\右)^ 2 +α\ \ _总和我= {0}^ {n} \左| \β_i \ |。\{对齐}$ $
(13)

这种方法发现一组稀疏的\β_i (\ \)。我们添加两个额外的步骤进一步sparsify这组参数。如果有连续的\(\β_i \ 0 ne \),我们都设置为零但第一块。然后,我们使用普通最小二乘法,适合选择的解释,我们递归删除\β_i (\ \)p\ (* > 0.01 \),在那里p\ \ (*)是Bonferroni纠正p值。使用LARS算法37重复这些步骤,我们hyperparameter的不同的值\α(\ \),我们使用符合最小化贝叶斯信息准则38。我们在图显示这个过程的结果。S4

从拟合参数\ (R_t \)

计算的值\ (R_t \)从健康参数,我们必须使用方程式。(5,712)。从这些方程,我们到达以下平等:

$ ${对齐}R_t = \ \开始压裂{\总和_ {i = 0} ^ t \β_i}{\伽马}+ 1 \{对齐}$ $
(14)

在大多数的\β_i (\ \)值是零。使用这个公式,我们到达图中给出的值。3和表1(正文)。我们展示了\ (R_t \)值为所有州数据图。3