SARS-ANI:全球开放获取的动物SARS-CoV-2事件数据集

科学数据体积9，文章号:438（2022）引用本文

4256访问
5引用
302Altmetric
指标细节

主题

摘要

COVID-19的病原SARS-CoV-2的人畜共患病源尚未完全确定。尽管在广泛的物种中报告了动物的自然感染，但关于动物宿主中的SARS-CoV-2仍存在很大的知识和数据缺口。我们使用两个主要的健康数据库提取非结构化数据，并生成了动物SARS-CoV-2事件的全球数据集。该数据集提供了统一的主机名称，整合了每个事件的相关流行病学和临床数据，并易于用于分析目的。我们还分享了用于数据技术和可视化验证的代码，并为数据探索创建了一个用户友好的仪表板。在动物中发生SARS-CoV-2的数据对于调整监测策略、防止动物宿主的形成以及制定未来的人类和动物疫苗接种计划至关重要。数据的公平性和分析的灵活性将支持在人-动物-环境界面上对SARS-CoV-2的研究工作。我们打算在至少一年的时间内每周更新这个数据集，并通过合作进一步开发它并扩大它的用途。

测量(s)	动物宿主的SARS-CoV-2事件
技术类型(年代)	从文本源手动收集数据
因素类型(年代)	ID•primary_source•archive_event_number•link_web•secondary_source•secondary_source_ID•secondary_source_web•host_com_orig•host_sci_orig•host_com_res•host_sci_res•host_colloq•host_sci_spec_res•家庭•epidemiological_unit•number_cases•number_susceptible•number_tested•number_deaths•年龄•性别•country_iso3•country_name•subnational_administration•城市•location_detail•date_confirmed•date_reported•date_published•related_to_other_entries•related_ID•test•sampling_type•test_2•sampling_type_2•test_3•sampling_type_3•negative_test•negative_sampling_type•negative_test_2•negative_sampling_type_2•reason_for_testing•症状•结局•living_conditions•source_of_infection•变体•control_measures•original_source•link_original_source
样本特征-有机体	动物宿主(年代)
样本特征-环境	家养•野生•圈养•养殖
样本特征-位置	全球

背景与总结

尽管2019年冠状病毒病(COVID-19)大流行是由人际传播驱动的，但其病原体严重急性呼吸综合征2型冠状病毒(SARS-CoV-2)是人畜共患病¹．在人身上的出现很可能涉及至少两次独立的人畜共患溢出(即动物对人传播)事件，这些事件来自中国武汉华南海鲜市场饲养的野生动物^2，3.．2020年2月报告了第一例正式确诊的动物病例，当时香港的一只狗在主人被诊断出COVID-19后不久检测出病毒呈阳性⁴．SARS-CoV-2是公认的多面手冠状病毒¹显示出感染多种动物物种的强大能力⁵，包括宠物，例如狗^4，6，7、猫^6，8，9和叙利亚仓鼠¹⁰；动物园的动物¹¹，例如大猩猩(https://www.science.org/content/article/captive-gorillas-test-positive-coronavirus),狮子^12，13，14、老虎^12，14，美洲狮¹³、亚洲小爪水獭(https://www.aphis.usda.gov/aphis/newsroom/stakeholder-info/sa_by_date/sa-2021/sa-04/covid-georgia-otters）;养殖动物，如水貂^15，16，17；自由放养的野生动物¹¹，例如白尾鹿^{18，19，20.}和豹²¹．感染sars - cov -2的动物可能表现出亚临床到严重的感染症状^4，14，17实施的干预措施包括从个人治疗到预防性扑杀。

动物感染主要由人-动物传播引起(“溢出”)，在某些情况下，可导致病毒在同种动物(如仓鼠)之间的进一步动物流行²²,貂皮¹⁶、老虎²³和白尾鹿^{18，19，20.}或在物种之间，例如从貂到猫²⁴．从人类到动物的其他溢出事件可能已经发生，但未被发现²⁵．最近，观察到动物通过养殖水貂传染给人类¹⁶，宠物仓鼠¹⁰、猫²⁶，可能还有自由放养的白尾鹿²⁷．这些次生溢出效应导致了水貂的大规模捕杀²⁸偶尔还会导致人与人之间的传播¹⁰．SARS-CoV-2不仅对公共卫生构成威胁，而且对动物健康和福利以及保护也是一种规模未知的威胁^{29，30.，31}．

关于动物中SARS-CoV-2的报告主要可从新发疾病监测规划(ProMED-mail) (https://promedmail.org/)和世界动物卫生组织(WOAH，前身为国际兽疫局)的世界动物卫生信息系统(https://wahis.woah.org/)．然而，这些数据是非结构化的(叙述性文本)和/或可在多个excel表格或PDF文件中使用，因此如果没有初步的、耗时的管理和格式化步骤，就无法使用。美国农业部(USDA)动植物卫生检验局(APHIS)发布了美国动物SARS-CoV-2确诊病例的仪表盘(https://www.aphis.usda.gov/aphis/dashboards/tableau/sars-dashboard)，而加拿大动物卫生监督系统(CAHSS)则设有加拿大的仪表盘(https://cahss.ca/cahss-tools/sars-cov-2-dashboard)．数据可以从apis - usda仪表板下载，但只能作为图像、PDF或PowerPoint(不是机器可读的)，而底层数据不能从CAHSS仪表板访问。丹麦和荷兰政府都有一个网站，提供有关各自国家水貂养殖场SARS-CoV-2的信息(https://www.foedevarestyrelsen.dk/Dyr/Dyr-og-Covid-19/Mink-og-COVID-19而且https://www.rijksoverheid.nl/actueel/nieuws，分别)，没有任何可能访问原始数据。

尽管世界卫生组织、粮食及农业组织(粮农组织)和世界卫生组织(世卫组织)最近发表了一份关于"优先监测野生动物中新冠病毒感染并防止动物宿主形成”（https://www.who.int/news/item/07-03-2022-joint-statement-on-the-prioritization-of-monitoring-sars-cov-2-infection-in-wildlife-and-preventing-the-formation-of-animal-reservoirs)，目前还没有关于动物中SARS-CoV-2事件的全面全球数据集，可以方便地输入、处理和分析。

在当前COVID-19大流行的背景下，FAIR(可查找、可访问、可互操作和可重用)数据的可用性³²对于了解当前和发展中的SARS-CoV-2在人与动物界面上的流行病学，并减轻这一和未来大流行的影响至关重要。本文遵循开放科学原则^33，34，我们记录和分享生产方法SARS-ANI这是一个全面的全球动物SARS-CoV-2事件数据集。我们提供了数据集的详细描述，并补充了用户友好的文档和材料(代码和存档报告)，以增强数据的理解和使用。我们还提供了一些使用实例，这些实例不仅揭示了全球范围内SARS-CoV-2动物感染的流行病学和临床模式，而且还揭示了国家和物种层面的流行病学和临床模式。生成的数据集是公开可用的，并且易于用于分析目的。使用统一的分类名称，SARS-ANI数据集极大地促进了对动物中SARS-CoV-2事件数据的访问和重复使用。该仪表板还允许非专家访问和查看SARS-CoV-2动物事件。持续分析动物中SARS-CoV-2发生数据对于及时调整动物和人类的监测、监测和疫苗接种计划，以及评估SARS-CoV-2对公众和动物健康以及生物多样性和保护构成的不断发展的威胁尤为重要。

方法

该数据集的数据是从两个主要的动物卫生数据库收集和整合的:i)新发疾病监测计划(ProMED-mail) (https://promedmail.org/)，这是国际传染病学会(ISID，https://isid.org/)，以及ii)世界动物卫生组织(WOAH，前身为国际兽疫局)的世界动物卫生信息系统(https://wahis.woah.org/)．

步骤1:集成ProMED-mail报表

ProMED-mail (https://promedmail.org/)是报告全球传染病暴发(暴发指在一个流行病学单位发生一个或多个病例)的最大公开系统。它提供关于疫情和疾病出现的报告(称为“帖子”)。导致发布ProMED-mail报告的信息流如下:从通过电子邮件收到的每日疫情通知中选择要发送的疾病事件，通过互联网和传统媒体进行搜索，并浏览官方和非官方网站。所有传入的信息都由编辑或副编辑审查和过滤，随后将它们发送给一个由主题专家审稿人组成的多学科团队，由他们评估信息的可信度和准确性，解释它，提供评论，并参考以前的ProMED-mail报告和科学文献³⁵．一个ProMED-mail报告(通过唯一的报告标识符标识)可以描述一个或多个运行状况事件。

感兴趣的ProMED-mail报告的集成遵循两个步骤:

i) ProMED-mail报告的选择

我们通过ProMED-mail网站上提供的“搜索帖子”功能，识别了描述动物中SARS-CoV-2事件的报告，即在动物中至少出现一个SARS-CoV-2个体病例。我们使用关键词“动物”和“COVID-19”(在promed邮件帖子的“主题”中一直使用，以报告与动物中SARS-CoV-2有关的信息)检索与动物中自然和实验感染或疫苗检测有关的报告，以及关于动物中SARS-CoV-2的一般讨论(注:虽然COVID-19是指由SARS-CoV-2引起的人类疾病，不应该用于动物，但ProMED-mail很方便地将这个关键词用于人类和动物)。描述自然发生的感染(即通过实验室方法证明了病毒的存在)或暴露(即通过实验室方法证明了SARS-CoV-2抗体的存在)的报告被手动过滤并考虑用于数据提取。截至提交日(2022年6月22日)，ProMED-mail数据库包括232份关于动物SARS-CoV-2的报告。

ii)链接到以前的报告

当运行状况事件仍在继续时，ProMED-mail将发布后续报告，其中提供对以前ProMED-mail报告的引用(在报告末尾或在文章末尾的“另请参阅”部分)。我们使用这些信息来确定每个报告事件与前一个事件的潜在关系(例如临床随访、病毒的进一步传播和治疗结果)，并将这些数据输入最终数据集。

步骤2:集成WAHIS报告

WAHIS (https://wahis.woah.org/)是一个基于网络的电脑系统，实时处理动物疾病的数据。世界动物卫生组织的数据反映了兽医处从世界动物卫生组织(原世界动物卫生组织)成员和非成员国家和领土收集的关于世界动物卫生组织所列家畜和野生动物疾病以及新出现的和人畜共患疾病的信息。根据WOAH陆地动物卫生守则³⁶，在动物身上发现SARS-CoV-2感染，符合向世界动物卫生组织报告新发感染的标准(https://www.woah.org/app/uploads/2021/03/a-reporting-sars-cov-2-to-the-oie.pdf)．只有授权用户，即世界动物卫生组织成员国代表及其授权代表，才能将数据输入世界动物卫生组织平台，向世界动物卫生组织通报相关动物疾病信息。

一个WAHIS报告(通过唯一的报告标识符进行标识)可能包含一个或多个爆发，每个爆发都通过唯一的爆发标识符进行标识。所有信息都可以在WAHIS界面上公开访问。

有关的WAHIS报告的整合分两步进行:

i) WAHIS报告的选择

我们使用动物疾病事件的WAHIS仪表板(https://wahis.woah.org/#/events)提取世界卫生组织成员国和非成员国通报的动物SARS-CoV-2感染病例。WAHIS发布即时通知(INs)和后续报告(FUR)，在各自的名称中通过前缀“IN”和“FUR”进行识别。即时通报提供关于新通报事件的信息，而FURs一般提供以前通报的正在发生的事件的最新情况(例如，新感染动物和新死亡动物的数量，新实施的控制措施)。

我们对“疾病”字段(“动物中的SARS-CoV-2(信息来源)”)和“报告日期”字段应用过滤器，从1中选择与SARS-CoV-2事件相关的报告^rst2019年12月至今。报告可在线查阅，也可作为单独的PDF或Excel文件下载，每个文件对应一份国家报告(即一份报告可包括若干次疫情)。截至提交日(2022年6月22日)，WAHIS仪表板包括311份关于SARS-CoV-2的报告。

ii)识别差距和数据集完成情况

ProMED-mail筛选了包括WAHIS报告在内的大量信息源。ProMED-mail帖子提到了用作信息源的WAHIS报告的事件ID，这使得可以在WAHIS仪表板上查询原始源。因此，我们选择首先在ProMED-mail数据库中识别动物中的SARS-CoV-2事件。在第二步中，我们使用WAHIS仪表板来识别差距，即完成之前输入的SARS-CoV-2事件(以下简称兄弟姐妹的事件)，并找到ProMED-mail中没有报告的其他事件(图。1)．

对于每个国家(使用WAHIS仪表板上的“国家/地区”过滤器)，我们通过将WAHIS报告与之前输入的所有国家ProMED-mail报告进行比较，确定兄弟姐妹事件，使用的信息包括物种、地方政府、实验室确认日期(由于不同实验室的确认可能存在差异，因此考虑±7天的缓冲)或当实验室确认日期缺失时的发表日期(在这种情况下，考虑30天的缓冲，因为发表日期强烈依赖于数据库)。我们在这里没有使用有关城市的信息，因为由于数据隐私，报告可能不一致地提到爆发的城市/村庄。

这一策略虽然耗时，但在整个数据提取过程中始终适用，确保了每次疫情信息的全面收集、数据的准确性和方法的可重复性。

数据提取

ProMED-mail提供详细的、基于文本的(叙述性)健康事件报告。这种数据是非结构化的，而WAHIS使用半结构化(.pdf文件组织成部分，包括自由文本)和结构化数据(.xlsx格式)来显示报告。每一份报告都由一名兽医进行人工审查，以保证对内容和背景的充分理解。信息是手工提取和编码的。

提取了以下事件信息(如果可用)，并将其输入到专用的.csv文件中的结构化模板中:

-动物宿主:共同名称(即来源提供的最具体的名称，英文)和来源中提到的学名(学名协调一致，只有属的第一个字母大写);
-地理位置:国家、地方政府、城市;
- SARS-CoV-2变种;
-日期:该病例经实验室确认、世卫组织报告并发表的时间;
-指标:病例数、死亡数、易感动物数。

此外，提取了以下关于动物患者/病例的信息来填充数据集:

——年龄;
——性;
-生活条件;
-测试的主要原因;
-怀疑感染来源;
-症状:用文中提到的一到几个关键词总结了据称与SARS-CoV-2有关的主要临床症状。操作员“和”将多个症状分开。

如上所述的提取数据被输入到报告中提到的数据集中，在输入前没有任何信息被解释。此外，为了便于对数据的理解、与其他来源的集成和分析，我们添加了以下5个患者属性:

-与国家生物技术信息中心(NCBI)分类学主干相协调的动物宿主的通用和科学名称(根据现有信息解析到物种或亚种级别)³⁷；
-东道主的口语化名称，即非专业语言中通常用来识别该动物的名称(例如“老虎”表示“苏门答腊虎”);
-宿主的学名解析到物种层面;
-从报告、专家知识或文献中检索到的动物宿主的高级分类(即科)。

最后，对于数据集中记录的每个SARS-CoV-2事件，我们报告了主要和次要信息源，即信息源名称(ProMED-mail或WAHIS)和在线报告链接，以及主要信息源所引用的原始信息源。在数据提取过程中使用的每个报告的副本被下载并保存为PDF文件。我们在保存的文件(ProMED-mail报告)上插入了时间戳，或者在文件名中指定了下载日期(不可能在WAHIS报告上插入时间戳)。

记录每个事件的数据与ProMED-mail和/或WAHIS报告中提供的信息相对应(参见时间戳或下载日期)。没有考虑通过ProMED-mail和(或)WAHIS对报告可能的后续版本或修改。

免责声明

使用来自WAHIS平台的数据需要提及以下声明:“世界动物卫生组织(WOAH)对本文所含数据的完整性或准确性不承担任何责任，特别是由于但不限于可能发生在其控制范围之外的任何删除、操纵或重新格式化数据”。

数据记录

数据集的每一行都代表动物中的一个SARS-CoV-2事件，由唯一标识符(字段)标识ID)．我们认为，当动物中存在病毒RNA(感染的证据)和/或抗体(接触的证据)时，一个或几个流行病学相关病例被确定为一个事件。流行病学相关病例包括属于同一农场的动物、一起圈养的动物、属于同一家庭的宠物，或在同一(一般为横向)研究中取样的动物，具有相似的事件和患者属性，即它们进行了相同的实验室检测并显示相同的结果(包括变异)，表现出相同的症状和疾病结局，并得到确认、报告(如适用)，并在同一天发表(例如，当同一物种的宠物，共享同一个家庭，表现出不同的症状时，它们被报告为两个不同的事件)。事件包括疫情的随访历史报告(例如，对动物临床状况的随访，病例确认后的变异鉴定)。

每个独特的SARS-CoV-2事件由50个构成数据集的定量和定性事件和患者属性(列)来表征。因此，数据集包含五个数字字段(number_cases，number_susceptible，number_tested，number_deaths,年龄)、三个日期字段(date_confirmed，date_reported,date_published)，一个字符字段(性)，以及33个字符串数据字段，包括事件唯一标识符(ID)、七个与主机名和分类法相关的字段，以及两个需要预定义字符串值的数据字段(epidemiological_unit而且related_to_other_entries)．8个元数据字段专门用于信息源(例如名称、链接)。

这个领域related_to_other_entries指定事件之间的潜在关系，从而允许识别在空间或时间上相关的事件以及后续报告(例如，当两个或多个事件中描述的动物是相关的)住在一起或者当后续报告出现更新的另一个事件，本身被称为更新)．在线表1描述最终数据集中显示的50个字段及其格式。补充文件1提供三个例子，说明SARS-ANI数据集的结构及编码方案。

我们在整个数据集中考虑了以下两个值:

NA(不适用):当字段不适用于事件时。例如，当只进行一次实验室测试时(现场测试)测验)，NA报告用于第二次和第三次测试(test_2而且test_3分别)。
NS(未指定):当信息与事件相关，但未在报告中指定时。例如，当为诊断目的而进行聚合酶链反应测试，但报告并没有提及所使用的样本，则样本类型(sampling_type)是NS．

伴随着数据集，我们发布R代码来执行数据的技术和可视化验证，以及用作信息源的ProMED-mail和WAHIS报告(截至提交日期，n = 364份报告)。我们还分享了未包含在数据集中的ProMED-mail和WAHIS报告列表以及排除的主要原因。这一策略，符合开放科学原则³⁴，旨在确保报告的数据是准确的，所有信息都可以被研究人员、政策制定者和公众访问。这也保证了数据收集的可重复性，可能会激发进一步的外部验证过程以及数据的大量重用。表中总结了SARS-ANI文件和产品1．在SARS-ANI仪表板上也免费提供事件显示(https://vis.csh.ac.at/sars-ani/，请参阅使用说明)。

表1 SARS-ANI文件和产品的详细信息。

全尺寸表

静态数据集

数据集的.csv文件格式的静态副本保存在Zenodo上³⁸(第一个版本v1.0于2022年4月11日上传)，所有版本均可在https://doi.org/10.5281/zenodo.6442730，连同表中所述的SARS-ANI相关文件(元数据、R代码、存档报告)1．截至提交日，最后一次上传的数据集静态副本(v1.1, 2022年6月20日)包含了2020年2月29日至2022年6月7日期间发布的所有SARS-CoV-2事件。1.1版显示了来自全球39个国家(覆盖150个次国家行政区)的14个科25种养殖、圈养、野生和家养动物中696个SARS-CoV-2事件的记录，代表了1,947个记录病例(感染和/或暴露)。在121个事件中，ProMED-mail和/或WAHIS没有报告病例数。数字2显示了数据集中所报告的SARS-CoV-2疫情的地理分布。表格2总结了全球每种动物宿主中报告的SARS-CoV-2病例数。

表2每种动物宿主全球报告的SARS-CoV-2病例数(感染或暴露)(截至提交日，2022年6月22日)。

全尺寸表

动态数据集

以.csv文件格式的SARS-ANI数据集的实时版本在GitHub存储库上公开可用，可在https://github.com/amel-github/sars-ani，连同表中所述的有关SARS-ANI文件1．我们计划至少在未来12个月内每周更新数据集。然后，根据资源的不同，数据集至少每半年更新一次。数据提取和验证的相同技术程序将应用于添加到数据集中的任何新事件。

GitHub接口允许用户标记数据集中潜在的不准确记录，这将触发一个纠错方案，主要包括通过另一个验证循环处理标记的记录，在需要时检查和替换错误字段。通过SARS-ANI GitHub存储库和仪表板(https://vis.csh.ac.at/sars-ani/(参见用法注释)，我们还希望激励动物卫生、流行病学和保护方面的专家支持我们填补记录中的潜在空白。GitHub接口允许任何人通过问题跟踪器对数据集和代码提出修改建议(例如报告错误和提交新数据)。代码的贡献可以通过拉请求来实现(参见贡献。医学博士,表1)．

限制

数据集仅包括在ProMED-mail和/或WAHIS上发表的SARS-CoV-2事件。因此，事件在数据集中的整合在很大程度上取决于该国向世界动物卫生组织的报告战略、对不同动物物种的研究和监测战略的强度(例如，是否对受感染家庭的宠物进行了系统调查)、媒体对诊断病例的报道，以及ProMED-mail团队对报告事件的接受程度。

此外，我们还确定了数据集中的五个次要限制:

1.
在各种信息来源中，没有详细描述动物中的一些SARS-CoV-2事件，特别是与水貂养殖场感染有关的事件，其中确诊病例和死亡人数往往缺失。此外，从报告中并不总是能够辨别水貂是否属于同一农场单位。在几份关于水貂养殖场SARS-CoV-2感染的报告中，指定了样本动物的数量，而没有指定阳性动物的数量(例如。https://wahis.oie.int/#/report-info?reportId=16733)，因此无法推断样本是否被合并。此外，2020年11月12日之前发生在丹麦和荷兰水貂中的SARS-CoV-2感染(https://www.woah.org/en/oie-statement-on-covid-19-and-mink/)没有出现在世界卫生组织的动物疾病事件仪表盘上，而这两个国家在毛皮养殖系统中承受了相当大的负担³⁹．因此，无法完成ProMED-mail中报告的那些事件的缺失值(例如案例数)。由于这些原因，该数据集无法准确估计SARS-CoV-2对水貂造成的经济和健康负担。
2.
关于水貂和白尾鹿的报告经常报告水坝的数量(有时是水坝和幼鹿)作为农场或鹿群中易感动物的数量，忽略了成年雄性。我们已经报告了信息源中给出的数字，因此，对于这些物种，每个事件中易感动物的数量可能被低估了。
3.
尽管不常见，但在ProMED-mail或WAHIS报告中发现了一些错误。例如，当实验室结果日期在采样日期之前，或者当测序被提及为第一次诊断测试时，尽管聚合酶链反应很可能在此之前进行。由于我们没有任何方法来检索正确的信息，所以我们输入了报告中提到的数据。
4.
为尊重和保护动物主人的隐私，ProMED-mail和WAHIS报告中提供的疫情地点(即城市或村庄)可能不代表疫情的确切地点，应谨慎解释。
5.
当多个事件相关时(例如，动物生活在一起:related_to_other_entries=住在一起)，易感动物的数目(number_susceptible)在两个事件中都是相同的，因此是多余的。同样，当属于同一物种并生活在一起的动物表现出不同的症状或进行不同的实验室测试(因此报告为不同的事件)，但作为控制策略的一部分被扑杀(即。related_to_other_entries=住在一起和control_measures=扑杀或有选择性的扑杀)，报告的死亡人数(number_deaths)对于这些事件是相同的(因此是冗余的)。虽然很少有记录与这些情况相对应，但如果对现场的事件进行过滤，可能会导致在一定程度上高估易感动物或死亡动物的数量related_to_other_entries而且control_measures没有相应的计算(例如，共同生活的农场动物的死亡数量应计算一次)。用于探索数据集的代码提供了如何使用过滤器的示例。

技术验证

收集数据的验证遵循以下几个步骤(图。1)．

质量控制和数据清理

首先，数据进行了质量控制和清理程序，其中检查每个字段的唯一值，以搜索不准确(例如包含印刷错误或不属于预定义的实体列表)，不可靠(例如值不具体)，不正确的格式(例如日期格式化为dd/mm/yyyy而不是yyyy-mm-dd)，或数据集中丢失的数据。此步骤在R语言中执行⁴⁰使用基函数独特的()．根据原始报告手动检查包含检测到错误的事件。必要时，修改、替换或删除错误值。

分类验证

拼写错误的动物名称和分类错误可能导致不正确的科学结论和糟糕的政策设计。此外，宿主名称的统一有助于整合其他数据集(例如关于宿主生物学特征、地理分布或与其他病原体关联的数据)。因此，对于每个事件，我们使用R⁴⁰包taxize⁴¹．我们使用函数检查学名是否最新，以及这些学名的拼写是否正确gnr_resolve ()(分数≤0.98的名称是人工检查的，必要时进行更正)。此外，每个通用名称的学名(反之亦然)都是根据NCBI分类主干进行解析的³⁷使用函数comm2sci ()（sci2comm ())．最后，通过查询NCBI数据库，使用函数验证了物种名称的高级分类学(即科)tax_name ()．

搜索重复事件

我们已经识别了重复事件，定义为在数据集中报告超过一次的唯一事件。事件被标记为重复，如果地理位置信息(即。国家，subnational_administration，城市,location_detail)，已解析的动物宿主名称(host_com_res而且host_sci_res)、性别、年龄、症状、日期(date_confirmed或date_reported如果date_confirmed失踪了还是date_published如果遗漏了另外两个日期)、病例数、死亡人数、易感者人数、进行的检测、结果以及与其他事件的关系(related_ID)。这一步是在R中执行的⁴⁰，使用dplyr包⁴²．针对原始信息源手动检查标记事件，以确认冗余。重复事件被删除。错误地标记为重复的事件已被纠正。将技术验证的三个步骤(如上所述)复制到R中的代码⁴⁰(表1)可于https://github.com/amel-github/sars-ani而在https://doi.org/10.5281/zenodo.6442730．

视觉验证

数据通过不同的图形显示进行可视化检查。图形和地图是用R生成的⁴⁰，使用包ggplot2⁴³, webr⁴⁴、visNetwork⁴⁵用于图形化可视化。可视化总结数据(通过地图、图形和交互式网络)的代码作为R Markdown文档提供(表1)，并于https://github.com/amel-github/sars-ani而在https://doi.org/10.5281/zenodo.6442730．

专家验证

专家判断被定义为在某一领域有经验的人的知情意见，这些人被其他人认为是该领域合格的专家，能够提供信息、证据、判断和评估。⁴⁶．首先，项目负责人审查了数据收集过程中遇到的尚未解决的问题，将数据集中记录的事件与原始报告进行随机验证，并随机检查数据集中ProMED-mail和WAHIS报告的条目。在第二步中，我们团队中的两位专家检查了数据及其图形显示，并随后提供了反馈。这些专家验证步骤能够澄清问题，并进一步解决数据集中潜在的遗漏。

使用笔记

SARS-ANI数据集是目前最全面的动物SARS-CoV-2事件全球数据集。数据集中显示的信息旨在促进对动物中SARS-CoV-2感染/暴露的广泛分析，从而进一步了解SARS-CoV-2在不同动物宿主中(国际、国家或次国家)的流行病学和影响。数据格式、健康事件的标准化编码和统一的主机名使数据集易于理解(对于非专家也是如此)，同时它们允许极大的分析灵活性和有趣的集成潜力。我们希望这些品质将加强跨部门和学科的数据重用和组合。

应对动物中的SARS-CoV-2事件

数据3.，4,5可视化地显示可以使用数据调查的许多问题中的一些问题的答案;其他问题/可视化可以从已发布的代码中计算(https://github.com/amel-github/sars-ani而且https://doi.org/10.5281/zenodo.6442730)：

每个动物宿主和国家的SARS-CoV-2病死率是多少?(无花果。3.）
在不同的动物宿主中发现了哪些SARS-CoV-2变体?(无花果。4）
为什么要对动物进行SARS-CoV-2检测?(无花果。5）

该数据集可以成为评估SARS-CoV-2对畜牧业(特别是水貂/毛皮动物)、宠物、野生动物(包括圈养野生动物)和保护计划的已实现和潜在威胁和影响的重要工具^30.，47．再加上关于检测成本、实施的控制措施(如大规模扑杀)以及养殖和圈养动物价值的经济数据，它可以促进动物卫生经济学研究，例如评估SARS-CoV-2感染对动物生产系统和保护规划的经济负担，或支持预防人畜共患大流行的成本效益分析⁴⁸．该数据集还可以通过确定保护动物健康的监测需求和有效地优先分配资源，特别是在资源有限的情况下，协助基于风险的兽医监测。

此外，SARS-ANI数据集可以通过集成其他数据集(例如VIRION⁴⁹)或移植并整合到现有的动物疾病平台(例如野生动物健康信息共享伙伴关系:https://whispers.usgs.gov/home或者野生健康网倡议:https://oneworldonehealth.wcs.org/Initiatives/WildHealthNet.aspx)．

最后，SARS-ANI制定的程序和标准化报告格式也适用于其他传染性威胁;同样，灵活和有充分记录的分析工具也可用于其他疾病的描述性流行病学。

一种健康监测战略

由于在人-动物-环境界面监测人畜共患疾病极具挑战性，因此需要采用综合的One Health方法来监测全球动物和人类中的SARS-CoV-2携带和感染情况¹⁸．能够对SARS-CoV-2事件进行综合分析和可视化的One Health工具至关重要。SARS-ANI数据集可与其他跨部门数据(如人类COVID-19病例数据、土地使用和环境数据)相结合，以支持在人-动物-环境界面上对SARS-CoV-2的研究工作⁵⁰例如，确定新冠病毒的传播和外溢热点，开发和调整新冠病毒事件的统一健康监测系统，阐明新冠病毒的自然生态。我们相信，SARS-ANI数据集提供及时可靠的信息，有助于跨专业和多部门的SARS-CoV-2预防和控制活动，包括制定相关的国家和国际法规和协议，以改善防范工作，降低人与动物之间的传播风险。在与人类生活密切的动物中共享关于SARS-CoV-2感染/暴露的信息将有利于兽医和公共卫生专业人员在人-动物界面上调查SARS-CoV-2病例(例如，需要检测与确诊为COVID-19的主人/照顾者接触过的宠物/圈养动物;样品类型和要进行的测试)。这些数据还可以提供背景信息，以便为国内和养殖物种的国际贸易制定切实可行的建议，这些物种在人类感染中的作用已得到承认¹⁰．此外，这些数据可用于制定和调整针对新出现的冠状病毒疾病的国家或全球One Health预防、防范和应对计划，并协助公共卫生官员完成任务。

最后，利用SARS-ANI和其他项目的经验^31，49在美国，进一步的研究可能会建立一个已知溢漏事件的全球数据集，这将增强我们对人畜共患病传播障碍和促进因素的理解，并训练回顾性和预测模型，以确定模式和预测未来的出现³¹．

SARS-ANI VIS:告知科学家、利益相关者和公众

SARS-ANI仪表盘，可在https://vis.csh.ac.at/sars-ani/，对动物中SARS-CoV-2事件的具体方面提供了直观的见解(图2)。6)．数据的可视化表示以叙述格式显示，其中信息通过垂直连接的片段传达。每个部分都有一个选定的主题，从总体概述开始，引出更具体的问题，例如跨物种的变异或报告的临床症状。分段划分的目的是为了便于理解信息，方便网页导航。每个部分都经过精心设计，以一种科学家和普通公众都能理解的方式展示预期的信息。因此，该仪表板将促进数据的获取，有利于动物卫生信息共享，并促进科学界、利益攸关方和公众对数据的全球理解。该仪表板旨在支持有关SARS-CoV-2在人与动物之间传播风险的公众教育，并提高公众对SARS-CoV-2大流行可能带来的野生动物保护问题的认识。仪表板链接到GitHub上可用的实时数据集(https://github.com/amel-github/sars-ani)，并会不断更新。

代码的可用性

SARS-ANI数据集的静态版本和数据集的相关文件(元数据、R代码、归档报告)已保存在Zenodo上³⁸，可在https://doi.org/10.5281/zenodo.6442730，供公众查阅。数据集的实时版本(以及相关文件)可以在GitHub上访问https://github.com/amel-github/sars-ani．请参阅代码发布中的README文件以获得进一步的说明。

参考文献

霍姆斯，e.c. COVID-19 -人畜共患疾病的教训。科学375， 1114-1115(2022)。
文章广告中科院谷歌学者
Worobey, M。等．华南市场是新冠肺炎疫情爆发的中心。预印在https://doi.org/10.5281/zenodo.6299600(2022)。
佩卡尔，j.e.。等．SARS-CoV-2的出现很可能是由至少两次人畜共患事件造成的。预印在https://doi.org/10.5281/zenodo.6291628(2022)。
坐下，t.h.c。等．狗感染SARS-CoV-2。自然586， 776-778(2020)。
文章广告中科院谷歌学者
Mahdy, m.a.a, Younis, W. & Ewaida, Z. SARS-CoV-2和动物感染概述。前面。兽医。Sci．7(2020)。
哈默，美国。等．在美国德克萨斯州有受感染主人的家庭中对猫和狗进行的SARS-CoV-2感染和病毒分离的连续测试。病毒13， 938(2021)。
文章中科院谷歌学者
Zambrano-Mila, m.s.， Freire-Paspuel, B, Orlando, s.a. & Garcia-Bereguiain, m.a.亚马逊丛林自由漫游犬的SARS-CoV-2感染。一个健康https://doi.org/10.1016/j.onehlt.2022.100387,100387(2022)。
张,问。等．武汉地区猫SARS-CoV-2血清学调查紧急情况。微生物感染。92013-2019(2020)。
文章中科院谷歌学者
米罗,G。等．在西班牙马德里，生活在covid -19阳性家庭的一只猫和三只狗感染了SARS-CoV-2。前面。兽医。Sci．8(2021)。
日圆,H.-L。等．SARS-CoV-2 delta变种(AY.127)从宠物仓鼠传播给人类，导致人际传播:一个案例研究《柳叶刀》399， 1070-1078(2022)。
文章中科院谷歌学者
Lecu, A, Bertelsen, M. F. & Walzer, C.《关于野生动物、动物园和SARS-CoV-2病毒的科学事实和知识》第五(v9) edn Ch. 4.4 (Alexis Lécu和Rafaela Fiuza编者)https://www.eazwv.org/page/inf_handbook(欧洲动物园和野生动物兽医协会，2022)。
巴特利特，s.l.。等．马来亚虎SARS-CoV-2感染情况及粪便纵向筛检(美洲豹)、东北虎(黑豹，底格里斯阿尔泰卡)，以及非洲狮(Panthera leo krugeri)在美国纽约布朗克斯动物园。J. Zoo Wildl。地中海。51， 733-744(2021)。
文章谷歌学者
Koeppel, K. N。等．在南非，SARS-CoV-2将人畜共患病逆转到美洲狮和狮子身上。病毒14， 120(2022)。
文章中科院谷歌学者
McAloose D。等．从人到人豹属:布朗克斯动物园的老虎和狮子自然感染了SARS-CoV-2。mBio11， e02220-02220(2020)。
文章中科院谷歌学者
陆,L。等．荷兰养殖水貂和相关人群对SARS-CoV-2的适应、传播和传播。Commun Nat。12， 6802(2021)。
文章广告中科院谷歌学者
穆宁克b.b.o.等．在水貂养殖场，人与水貂之间的SARS-CoV-2传播，并传播回人类。科学371， 172-177(2021)。
文章广告谷歌学者
Oreshkova, N。等．2020年4月和5月，荷兰养殖水貂的SARS-CoV-2感染情况。欧元Surveill。25， 2001005(2020)。
文章谷歌学者
黑尔，V. L。等．自由放养白尾鹿感染SARS-CoV-2。自然602， 481-486(2022)。
文章广告中科院谷歌学者
钱德勒，j.c.。等．野生白尾鹿的SARS-CoV-2暴露(Odocoileus virginianus)．PNAS118， e2114828118(2021)。
文章中科院谷歌学者
库奇普迪，s.v。等．来自人类的多重溢出效应以及SARS-CoV-2在白尾鹿中的进一步传播。PNAS119， e2121644119(2022)。
文章中科院谷歌学者
Mahajan, S。等．放养豹全身感染SARS-CoV-2 (Panthera pardus fusca)在印度。预印在https://www.biorxiv.org/content/10.1101/2022.01.11.475327v1(2022)。
Sia, s.f.。等．SARS-CoV-2在金仓鼠中的发病机制和传播。自然583， 834-838(2020)。
文章广告中科院谷歌学者
Grome, H。等．2020年，美国田纳西州，马来亚虎和人类爆发SARS-CoV-2疫情。紧急情况。感染。说。28， 833(2022)。
文章中科院谷歌学者
范·阿尔特，A. E。等．感染水貂农场的猫和狗感染SARS-CoV-2。Transbound。紧急情况。说．https://doi.org/10.1111/tbed.14173(2021)。
寻找携带冠状病毒的动物——以及为什么它很重要。自然591， 26-28(2021)。
文章广告中科院谷歌学者
尸罗,T。等．疑似SARS-CoV-2猫传人，泰国，2021年7月至9月。紧急情况。感染。说．28(2022)。
皮克林,B。等．高度发散的白尾鹿SARS-CoV-2，鹿向人传播的可能性。预印在https://www.biorxiv.org/content/10.1101/2022.02.22.481551v1(2022)。
弗鲁托斯，R. & Devaux, C. A.为了保护COVID-19疫苗而大规模扑杀水貂:这合理吗?新的微生物新的感染38， 100816(2020)。
文章中科院谷歌学者
Akinsorotan, O. A.， Olaniyi, O. E.， Adeyemi, A. A. & Olasunkanmi, A. H.冠状病毒大流行:对生物多样性保护的影响。前面。水3.(2021)。
Bang, a . & Khadakkar, S.全球危机中的生物多样性保护:后果和前进的道路。PNAS117， 29995-29999(2020)。
文章广告中科院谷歌学者
法格尔。等．评估人类对野生动物病原体传播的风险，以保护和公共卫生。生态。列托人。25， 1534-1549(2022)。
文章谷歌学者
威尔金森博士等．科学数据管理和管理的FAIR指导原则。科学。数据3.， 160018(2016)。
文章谷歌学者
维森特-赛斯，R.和马丁内斯-富恩特斯，C.开放科学现在:一个系统的文献综述的综合定义。j .总线。Res。88， 428-436(2018)。
文章谷歌学者
开放知识基础:开放数据意味着更好的科学。公共科学图书馆杂志。9， e1001195(2011)。
文章中科院谷歌学者
于，V. L. &麦道夫，L. C. ProMED-mail:一种新兴疾病的早期预警系统。中国。感染。说。39， 227-232(2004)。
文章谷歌学者
世界动物卫生组织。陆地动物卫生规范https://www.woah.org/en/what-we-do/standards/codes-and-manuals/terrestrial-code-online-access/(2021)。
肖赫。等．NCBI分类法:关于策展、资源和工具的全面更新。数据库(牛津)2020(2020)。
Nerpel,。等．SARS-ANI:全球开放获取的动物SARS-CoV-2事件数据集。Zenodohttps://doi.org/10.5281/zenodo.6442731(2022)。
Koopmans、M. SARS-CoV-2和人-动物界面:水貂养殖场的疫情。柳叶刀感染。说。21， 18-19(2021)。
文章中科院谷歌学者
R核心团队。R:用于统计计算的语言和环境https://www.R-project.org/(R统计计算基金会，维也纳，奥地利，2021)。
张伯伦，S. A. & Szöcs, E. taxize:分类搜索和检索R.;F1000Res。2， 191(2013)。
文章谷歌学者
维克汉姆，H.， François, R.，亨利，L.和Müller, K。dplyr:数据操作的语法https://CRAN.R-project.org/package=dplyr(2022)。
韦翰,H。ggplot2:数据分析的优雅图形(Springer-Verlag纽约，2016)。
韦勃:基于网络分析的数据和函数https://CRAN.R-project.org/package=webr(2020)。
阿尔门德，B. V.， Thieurmel, B. & Robert, T.。visNetwork:使用' vis.js '库的网络可视化https://CRAN.R-project.org/package=visNetwork(2021)。
Escobar-Pérez, J. & Martínez, a . Validez de contenido y juicio de expertos: Una aproximación a su utilización。Avances en Medición6， 27-36(2008)。
谷歌学者
法格尔。等．评估人类对野生动物病原体传播的风险，以保护和公共卫生。生态。列托人。0， 1-16(2022)。
谷歌学者
伯恩斯坦，a.s.。等．人畜共患传染病初级预防的成本和收益。科学。睡觉。8， eabl4183(2022)。
文章广告中科院谷歌学者
卡尔森，c.j.。等．一个网络中的全球病毒集(VIRION):脊椎动物-病毒关联的图谱。mBio13， e02985-02921(2022)。
文章谷歌学者
阿穆阿西，j.h.。等．呼吁成立COVID-19单一健康研究联盟。《柳叶刀》395， 1543-1544(2020)。
文章中科院谷歌学者

下载参考

确认

我们感谢奥地利维也纳兽医大学兽医公共卫生和流行病学部门的同事们为数据的不同可视化展示提供的投入。SARS-ANI团队非常感谢奥地利维也纳兽医大学法律系就数据(重新)使用提供的建议，特别是对C. Ruckenbauer的建议。我们也感谢W. Schueller对GitHub界面的支持，以及W. H. M. van der Poel教授为WAHIS报告提供的有用信息。

资金

本文的开放获取资金由维也纳兽医大学(Vetmeduni Vienna)提供。

作者信息

作者及隶属关系

维也纳兽医大学兽医公共卫生和流行病学研究中心，奥地利维也纳兽医广场1,1210号
Afra Nerpel, Annemarie Käsbohrer & Amélie Desvars-Larrive
维也纳复杂性科学中心，奥地利维也纳Josefstaedter大街39号，1080号
杨柳华影，Johannes Sorger & Amélie Desvars-Larrive
野生动物保护协会，2300南大道，布朗克斯，纽约，10460，美国
克里斯等
维也纳兽医大学野生动物生态研究所，奥地利维也纳Savoyenstrasse 1,1160
克里斯等
兽医农场，维也纳兽医大学，克雷梅斯堡13,2563，波坦斯坦，奥地利
天使爱美丽Desvars-Larrive

作者

身兼Nerpel

查看作者出版物

您也可以在PubMed谷歌学者
Liuhuaying杨

查看作者出版物

您也可以在PubMed谷歌学者
约翰内斯·佐尔格

查看作者出版物

您也可以在PubMed谷歌学者
安玛丽Kasbohrer

查看作者出版物

您也可以在PubMed谷歌学者
克里斯等

查看作者出版物

您也可以在PubMed谷歌学者
天使爱美丽Desvars-Larrive

查看作者出版物

您也可以在PubMed谷歌学者

贡献

A.N.开发了结构化模板和编码方案，提取数据，调查标记错误和冗余，更新数据集，存档信息源，并帮助撰写手稿。a.d.l构思了这项研究，协调了数据集的制作，开发了用于技术和视觉验证的代码，创建了图表和表格，并帮助撰写了手稿。L.Y.创建了仪表板，包括概念化、开发数据故事和数据自动化过程。J.S.支持了仪表盘的开发，并帮助撰写了手稿。A.K.和C.W.参与了数据审查过程，并帮助撰写了手稿。

相应的作者

对应到天使爱美丽Desvars-Larrive．

道德声明

相互竞争的利益

作者声明没有利益竞争。

额外的信息

出版商的注意施普林格自然对出版的地图和机构从属关系中的管辖权主张保持中立。

补充信息

补充文件1

在线表

仅在线表1在最终数据集和格式中显示的字段描述。

全尺寸表

权利和权限

开放获取本文遵循知识共享署名4.0国际许可协议(Creative Commons Attribution 4.0 International License)，允许以任何媒介或格式使用、分享、改编、分发和复制，只要您对原作者和来源给予适当的署名，提供知识共享许可协议的链接，并注明是否有更改。本文中的图像或其他第三方材料包含在文章的创作共用许可中，除非在材料的信用额度中另有说明。如果内容未包含在文章的创作共用许可协议中，并且您的预期使用不被法定法规所允许或超出了允许的使用范围，您将需要直接获得版权所有者的许可。要查看此许可证的副本，请访问http://creativecommons.org/licenses/by/4.0/．

转载及权限

关于本文

引用本文

聂佩尔，A，杨，L，索尔杰，J。et al。SARS-ANI:全球开放获取的动物SARS-CoV-2事件数据集。科学数据9， 438(2022)。https://doi.org/10.1038/s41597-022-01543-8

下载引用

收到了：2022年4月15日
接受：2022年7月8日
发表：2022年7月23日
DOI：https://doi.org/10.1038/s41597-022-01543-8

主题

摘要

背景与总结

方法

步骤1:集成ProMED-mail报表

步骤2:集成WAHIS报告

数据提取

免责声明

数据记录

静态数据集

动态数据集

限制

技术验证

质量控制和数据清理

分类验证

搜索重复事件

视觉验证

专家验证

使用笔记

应对动物中的SARS-CoV-2事件

一种健康监测战略

SARS-ANI VIS:告知科学家、利益相关者和公众

代码的可用性

参考文献

确认

资金

作者信息

作者及隶属关系

贡献

相应的作者

道德声明

相互竞争的利益

额外的信息

补充信息

在线表

权利和权限

关于本文

引用本文

分享本文

搜索

快速链接