介绍

2019年12月,一个新的冠状病毒的出现和迅速传播到世界各地,引起了规模空前的全球大流行。SARS-CoV-2,导致COVID-19的病毒,是一种积极意义单链RNA冠状病毒1。由于病毒的快速传播率,无症状感染,出现多种传染性变体2,3,及时有效的治疗模式的发展一直是一个全球性的挑战4。而在疫苗研发的努力导致了紧急使用授权多个有效的疫苗5和最近批准的冠状病毒瞄准抗病毒化合物6,我们相信理解感染宿主细胞的生物学反应将使我们能够开发新的疗法,可以与目前的抗病毒药物和疫苗预防严重疾病。此外,我们还研究了其他普通感冒的冠状病毒向目标发展pan-coronavirus治疗可以减缓或阻止病毒在宿主细胞7

我们用基因表达谱的化合物和遗传扰动作为了解病毒复制的生物探针。使用这种方法,我们预测化合物可能阻碍病毒生产的宿主细胞。鉴于SARS-CoV-2 SARS-CoV-1密切相关,都是β冠状病毒家族的8,9和丰富的SARS-CoV-1数据,我们使用从病毒基因表达的研究这两种病毒对我们的预测。开始与我们的专有的方法计算引擎,分析疾病的细胞基因表达数据和化学和遗传扰动生成硅预测可能的治疗。朝着这个目标,我们在网上筛选现有22000多个化合物由超过一百万基因表达谱,迅速产生候选化合物可以进一步测试。总之,我们发现化学微扰翻译起始或规定,热休克,蛋白酶体途径,有效地控制病毒复制pan-virus或特异的方式。小分子如bortezomib,高三尖杉酯碱和tanespimycin影响这些途径能干扰病毒生产对SARS-CoV-2或普通感冒病毒hcov - 229 e和HCoV-OC43。

结果

基因表达在网上“transcriptotypic屏幕”的方法

因为基因相似性SARS-CoV-1 SARS-CoV-2,我们使用人类肺癌细胞系的基因表达谱,从患者外周血感染SARS-CoV-1或SARS-CoV-2预测。宿主细胞响应每个条件都是单独使用资料预测和检测对细胞反应的基因表达谱库22000多独特的化合物或单独基因扰动。

从最初的原始预测,我们执行第一轮选择排名基于复合的次数的化合物通过Fisher精确检验在每个独立的输入数据。我们相信这严格的标准使我们能够确定化合物与最强的潜在影响病毒生产。我们一共发现了1416个这样的排名化合物来自6700多个潜在的化合物,可以很快的,因此测试。在这一轮的测试中,优先分配给组代表同一类化合物的作用机制(农业部)如果多个最高排名。然后添加一个额外的过滤器只专注于推出或临床阶段的化合物和测试从每个感兴趣的恐鸟代表候选人。总共五个化合物,即trametinib (MEK抑制剂),bortezomib(蛋白酶体抑制剂),高三尖杉酯碱(蛋白质合成抑制剂),达沙替尼(bcr - abl激酶抑制剂)和拉西(钙通道阻滞剂)被选为测试SARS-CoV-2感染维洛细胞。选择性指数(SI)被用作测定化合物的治疗效益/风险。

3.34上述化合物,trametinib (SI)和bortezomib (SI 35.9和14.63 SI)显示anti-SARS-CoV-2活动和细胞毒性超过50μM(表1,无花果。1a和b)。高三尖杉酯碱对SARS-CoV-2是高效,也表现出一定程度的毒性。然而,高三尖杉酯碱的SIs(表12.84和24.061,无花果。1a和b)表明,可能有一个合理的治疗窗anti-SARS-CoV-2活动再诱导细胞毒性。

表1预测anti-SARS-CoV-2化合物体外有效性测试从两个独立轮测试。
图1
图1

(一个)病毒抑制和细胞生存曲线用于生成表1第一轮。(B)病毒抑制和细胞生存曲线用于生成表1第二轮。(C)比较药物农业部类频率计数和预测复合预测排名在前100的化合物与最强的预测抗病毒的力量。

下一组化合物测试是由最高排名化合物扰乱相同的途径。我们测试了两个强烈预测蛋白酶体抑制剂即bortezomib,显示anti-SARS-CoV-2活动在前面的实验中,模拟ixazomib。我们也选择两个高排名的化合物从热休克通路,即tanespimycin和ganetespib。蛋白酶体途径和热休克途径明显在排名前100的化合物(图表示。1c)。符合最初的研究中,bortezomib与SI和ixazomib显示anti-SARS-CoV-2活动分别为14.63和4.27(表1)。Tanespimycin ganetespib,另一方面,没有显示出活动对SARS-CoV-2维洛细胞试验尽管有很强的预测分数从发动机(表1,无花果。1b)。高三尖杉酯碱的强有力的抗病毒活动在两个独立的研究(图是相一致的。1a和b)。

作为另一个测试阐明SARS-CoV-2宿主反应的生物,我们确定了若干弱预测的化合物(贫困行列),但与小说恐鸟。Meclofenamic酸(非甾体类抗炎),sitagliptin (DPP4拮抗剂)和levetiracetam (anti-convulsant,恐鸟不清楚)没有显示有意义anti-SARS-CoV-2活动而sr - 2640(白三烯D4和E4受体拮抗剂)和azd - 1208 (PIM激酶抑制剂)非常贫穷的SI值(表2,无花果。2)。

表2逆转分数平均预测anti-SARS-CoV-2化合物体外有效性测试。
图2
图2

病毒抑制和细胞生存曲线用于生成表2

人类冠状病毒功效的化合物对常见病原体

我们也想了解如果这些化合物及其目标通路在调节病毒的宿主反应有更广泛的应用,特别是其他冠状病毒。这两种感冒病毒,hcov - 229 e和HCoV-OC43分别属于冠状病毒α和β的子群。SARS-CoV-1和SARS-CoV-2也在beta小组8,9。我们测试了bortezomib tanespimycin,高三尖杉酯碱对这两种感冒病毒在人类肺纤维母细胞细胞系。我们的结果显示应变具体对这些化合物的敏感性。Bortezomib没有显示出活动对hcov - 229 e或HCoV-OC43三个独立研究(表3,无花果。3),尽管它对SARS-CoV-2有利的SIs(表1)。Tanespimycin,另一方面,是高度有效的针对hcov - 229 e和HCoV-OC43 EC50小于1 nM(表3,无花果。3),尽管它并没有表现出在维洛细胞anti-SARS-CoV-2活动研究(表1)。高三尖杉酯碱能有效应对hcov与EC - 229 e和HCoV-OC4350s < 100海里(表3,无花果。3),以及针对SARS-CoV-2平均EC50/集成电路50在300纳米(表1)。

表3 (A) EC50,CC50的兴趣,如果指数3化合物MRC5细胞感染或HCoV-OC43 hcov - 229 e。
图3
图3

电子商务50与CC50曲线与表3化合物3的测试对hcov - 229 e和HCoV-OC43 MRC5细胞。

适合小分子干预途径预测

除了我们测试的化合物,我们还调查了通路,由排名前100的预测化合物。最高的化合物与已知的恐鸟,我们发现化合物代表热休克,蛋白酶体和蛋白质合成通路排名非常高我们的方法除了有效地减少病毒生产在我们的实验(图。1c)。相比之下,代表相关的神经递质类化合物(如5 -羟色胺受体拮抗剂、多巴胺受体拮抗剂)和炎症(脂肪氧合酶、组胺、趋化因子)通常是由排名更低的化合物(图表示。4)。如前所述,盐酸levetiracetam和sr - 2640并没有导致病毒生产(表上有意义的影响2)。

图4
图4

可视化的药物类频率计数和预测强度排名所有预测anti-SARS-CoV-2化合物。预测药物恐鸟总结和排名都是有用的工具来生成见解生物学途径重要SARS-CoV-2感染宿主细胞。最常有的恐鸟的排行榜,排名预测化合物的免疫类型(IKK抑制剂),包括抗癌类型(mTOR和MEK抑制剂)和展开的蛋白质反应/ UPR类型(蛋白酶体抑制剂,HSP抑制剂)。我们假定抗癌和UPR化合物可能与宿主细胞免疫类型化合物的反应快速的病毒复制,同时反映出抗病毒宿主细胞产生的炎症反应。

利用基因表达谱击倒探测器主机响应生物学

通过处理的基因表达谱基因降价以同样的方式作为我们compound-generated基因表达谱,我们生成一个列表撞倒,基因表达谱的基因预测由Auransa引擎显示强劲anti-SARS-CoV-2活动。使用预测基因通路分析目标发现显著富集的蛋白酶体途径和热休克途径从超几何测试假定值为0.01和0.07,分别。事实上,shRNA击倒HSP90AB1排名第14最有可能的候选人在宿主细胞逆转SARS-CoV-2签名。

Deconvoluting生物学预测

为了更好地理解背后的农业部预测的化合物和显示效果,我们探讨了生物原理基础产生三个可行的预测的化合物,关注途径被认为重要的引擎制作这些预测(表1)。我们的算法发现NF-kappaB信号,蛋白酶体/ ER应激活动,和细胞周期调控受到bortezomib是关键目标。Tanespimycin显示在网上对热休克的影响途径,氧化应激反应、脂质代谢、细胞周期。高三尖杉酯碱对一组更大的生物过程的影响包括胆固醇和类固醇生物合成,细胞周期,NF-kappaB信号(表4)。

表4选择性途径确认使用顶级基因预测的Auransa引擎来逆转抗病毒化合物基于字符串DB分析。

讨论

我们用我们的专用计算引擎预测化合物和目标为了研究SARS-CoV-1感染宿主细胞反应,SARS-CoV-2和2感冒冠状病毒。我们最强烈表明,预测化合物属于类的化合物调节以下途径:PKC, SRC, HSP、IKK, mTOR, ACE和蛋白酶体(无花果。4)。有趣的是,最经常预测药物类在1416独特的化合物是神经递质相关类(如5 -羟色胺受体拮抗剂、多巴胺受体拮抗剂)。然而,这些化合物通常有较低的排名从热休克化合物相比,蛋白酶体和基因(图翻译类。4)。Levetiracetam,最常见的化合物之一,但低级类别,没有抗病毒活动(表2,无花果。2)。相反,我们取得的积极成果是来自高排名预测化合物属于细胞生长,蛋白酶体和热休克药物类。这些结果表明药物类的频率可能不是一样重要化合物选择排名预测是基于发动机的疾病逆转强度得分(无花果。4)。计算药物类频率也更频繁地注释的偏见,也许老和更大的流行类的化合物相比,更新或小类的化合物。

许多化合物预测或检测潜在的活动对SARS-CoV-2自年初以来流行的其他研究小组。许多早期和晚期的正在进行的临床试验的重点是属于抗炎化合物主要或直接抗病毒类增长10。我们的引擎识别这些报道anti-SARS-CoV-2化合物,特别是吐根碱(蛋白质合成抑制剂),氯硝柳胺(驱虫剂)和pralatrexate(抗肿瘤药叶酸代谢抑制剂模拟)11,12,13。氯硝柳胺和吐根碱展示了令人印象深刻的anti-SARS-CoV-2能力在临床前发表的研究中,报告如果指数分别为178.57和176.65。他们是排名# 6和# 28日在我们的预测。Pralatrexate, IC500.008μM13排名在前60%的学生。

一个有趣的途径在硅片预测是蛋白酶体途径。蛋白酶体抑制剂bortezomib和ixazomib功效在控制病毒载量没有明显的细胞毒性。的两个,bortezomib表现出更多的力量。ubiquitin-proteasome通路是一个关键通路调节多种细胞过程。病毒劫持这一途径的传播14。有趣的是,我们并没有发现bortezomib对感冒病毒是有效的。目前还不清楚为什么ubiquitin-proteasome通路抑制抗寒病毒化验没有影响。其中一个原因可能是特定对蛋白酶体抑制病毒。我们也不能排除细胞类型特异性影响体外试验的结果。此外,蛋白酶体抑制剂是否能被开发作为抗病毒取决于其功效与体内毒性资料。我们的运动计算临床血液病中的作用暴露公开已知的临床资料,并发现它是通过静脉注入大约580海里癌症(见材料与方法)。集成电路50年代在血液病中的作用在体外实验中与CCμMμM 1.39和3.4250> 50μM,这表明可能存在一个合理安全的窗口。

一些出版物也提到bortezomib作为一个潜在的候选人在网上通过不同方法或通过在实验室化合物筛选。在硅片的方法包括预测分析转录因子调控,蛋白质相互作用网络。锅等和Adhami等使用预选的基因集代表病毒反应预测anti-COVID-19化合物15,16。兴等使用抗病毒药物被称为内部比较来识别和测试化合物可以显著逆转COVID-19病毒签名17。这些不同的方法都导致bortezomib anti-SARS-CoV-2候选人。这些研究,连同我们的无监督(没有一个已知的训练集,预选的基因,或以前阳性化合物“点击率”)在硅的方法,进一步验证了蛋白酶体途径作为一个重要途径,可以作为抗病毒策略目标。

下通路的重要性在我们的预测是RNA翻译。我们预测和验证体外,核糖体抑制剂高三尖杉酯碱高效SARS-CoV-2和寒冷的冠状病毒。舒伯特等表明Nsp1(也称为主机关闭因素)干扰宿主mRNA的核糖体mRNA通道停止翻译作为宿主防御SARS-CoV-2感染18。虽然针对一些关键作为宿主细胞RNA翻译可能造成负面影响,我们认为高三尖杉酯碱,一种抑制剂的核糖体复杂,应该进一步研究作为一个潜在的抗病毒药物。即使停止RNA翻译可以是有害的对宿主细胞和病毒,SIs的高三尖杉酯碱(12.84和24.06,表1,无花果。1a和b)表明可能有足够的窗口给宿主细胞优势通过阻止病毒的机制依赖于复制。其他报告使用基于体外细胞筛选FDA批准的药物减少TMPRSS2或计算机预测影响IFN-beta基因还发现了高三尖杉酯碱是一种很有前途的候选人19,20.。bortezomib类似,这些研究,加上独立鉴定我们的引擎,表明基因翻译是一个重要的机械使用的病毒复制。我们还表明,高三尖杉酯碱是强有力的反对hcov与EC - 229 e和HCoV-OC4350s < 100海里,表明也许RNA翻译可能是一个共同的主题,可以利用一锅anti-coronavirus策略。此外,我们计算了高三尖杉酯碱临床接触约66海里。集成电路50高三尖杉酯碱的年代是0.16μM和0.26μM在我们的测试(见材料与方法),因此我们也相信额外的努力是必要的探索高三尖杉酯碱作为一个潜在的锅anti-coronavirus化合物,必须考虑虽然高三尖杉酯碱的已知的不良反应21。然而,同样值得注意的是,患者COVID-19喷雾高三尖杉酯碱的临床试验正在进行22

最后化合物,tanespimycin,预测非常强烈SARS-CoV-1和SARS-CoV-2数据但令人惊讶的是,无论是tanespimycin还是第二代一半抑制剂ganetespib展出抗病毒功效SARS-CoV-2化验。相比之下,tanespimycin非常强有力的反对2冷冠状病毒。有趣的是,李et al表明10μM tanespimycin有效抑制病毒SARS-CoV-1活动,SARS-CoV-2,和MERS-CoV Huh-7细胞23。我们相信一半途径值得进一步研究在其他细胞类型和条件。此外,我们假设对SARS-CoV-2 tanespimycin体外有效性差异可能部分由于细胞模型的差异(即使用。维罗与Huh-7)。之前出版躲避anti-SARS-CoV-2药物反应差异依赖细胞株的方式州立和Calu-3细胞24

remdesivir, 2020年最初开发治疗埃博拉病毒RNA聚合酶抑制剂患者,被发现在COVID-19患者在临床试验中表现出临床症状明显改善,随后批准了2020年10月在美国25。我们注意remdesivir不是预测的方法。这可能是因为我们的方法使用受感染宿主细胞的基因表达谱预测化合物,而不是针对病毒蛋白质。Remdesivir,另一方面,目标病毒RdRp,与人类许多褶皱特异性RNA聚合酶II和线粒体RNA聚合酶18,19,20.,因此,我们不希望看到remdesivir或任何其他病毒袭击化合物使用我们的方法来预测。

另一点值得一提的是,我们在网上预测的重点是宿主细胞对病毒感染的反应,而不是针对特定的病毒蛋白,如SARS-CoV-2峰值蛋白质。SARS-CoV-1和SARS-CoV-2数据用于预测包括感染宿主细胞的基因组特征,不是病毒基因组数据。我们相信基于宿主细胞的方法使预测更多功能和关注更广泛的宿主防御通路可能是现有的目标化合物的更快的开发周期治疗。

总之,我们的方法指出我们可以针对一些关键宿主细胞通路停止冠状病毒复制,即蛋白酶体通路、蛋白质合成或翻译后调节机械,热休克系统。我们确定了化合物在上面的途径是再利用的候选人。尽管这些潜在候选人的安全性配置文件需要考虑在一个抗病毒的背景下,我们认为,再利用药物与临床批准或先进的临床阶段接受的临床安全性将大大缩短开发时间,并提供合适的治疗在一个正在进行的大流行。事实上,一些现有药物推荐治疗COVID-19住院患者,包括抗病毒药物(如remdesivir),抗炎药物(如baricitinib和糖皮质激素)和静脉注射单克隆抗体29日

我们证明了一个在硅片的方法如我们,没有预定义组基因或必要性训练使用现有已知的抗病毒药物,可以生成有前途的抗病毒化合物和脆弱的路径预测,与体外有效性和合理的细胞毒性。重要的是,我们预测我们关注化合物和途径可以调节宿主反应更pan-coronavirus的方式而不是抑制特定的病毒蛋白。这些化合物可能有SARS-CoV-2以外的更广泛的临床应用治疗我们的体外结果所示,不受制于以高三尖杉酯碱的病毒株。未来进一步的研究预测的化合物在人类细胞系(例如,主人体呼吸道上皮细胞或Calu-3)也可能提供其他见解的差异在不同的生物相关系统功效。我们相信我们的工作显示了抗病毒治疗大力支持发展集中在主机响应监管。

材料和方法

数据管理和处理

SARS-CoV-1 SARS-CoV-2研究中使用的分析和策划,从NCBI基因表达综合(GEO)。病毒感染的基因签名中包含补充表1

测试化合物的基因签名从NCBI地理和SRA策划。加入相应的数字包括在补充表2

RNASeq数据处理从fastq格式TPM值使用鲑鱼30.。微阵列数据下载从NCBI地理但可能进一步加工处理规范的数据显示数据出版商。如果数据集出版原始分数,我们可以申请RMA或分位数转换。所有基因表达数据集的分布和规模然后检查,以确保它们是比较没有明显的异常和偏态。之前所有的数据集复合预测证实log2规模,虽然促进了日志褶皱变化为基础计算,也可以减少潜在的极端值的影响。日志褶皱变化(LogFC)值是通过对比计算总共14选择病毒感染条件对相应的控制。

Auransa策划基因表达数据库的化合物和遗传扰动包括超过一百万的基因表达谱在超过22 K独特的化合物(药物诱导的基因表达特征,挖掘)。挖掘数据被用来评估复合反转强度对人体细胞产生的基因表达谱感染病毒的兴趣。所有公开可用的基因表达谱从地理下载。

计算复合预测

复合预测,我们设计了预测算法的分数并选择化合物的反转效应最大化人类基因组表达病毒感染下,这些化合物可能有潜在的纠正患者表型受到病毒感染。部分,该算法是基于GSEA的概念31日。所有基因在基因表达谱中使用的算法,没有任何可能的偏见的预选结果。我们的算法也不需要训练在任何预先存在的已知抗病毒化合物列表,因此打开我们发现化合物和关键路径以一种无监督的方式。

逆转分数计算后,我们使用Fisher精确的基于排名的方法。Fisher精确检验是用于检查如果任何单一化合物有很大good-hit-bad-hit计数率相比,所有其他化合物在相同的挖掘。执行罗斯福校正和过滤意义阈值为0.05。罗斯福的阈值是在网上申请所有化合物测试每一对比,即。业务,Benjamini /罗斯福计算多个测试修正。每次化合物有很大的罗斯福值,它被认为是一个计数为1。Fisher精确检验是进行每个单独对比他们独立处理在研究不平均。最后,计数所有的总数输入条件总结成一个单一的累计金额排名。打破排名的关系,我们也算药物数量的百分比签名实现逆转分数阈值/药物总数签名为单个化合物形成鲜明对比,Fisher精确检验取得了一个重要的结果。50个顶级排名批准化合物补充表中列出3

我们还测试了化合物可能不会通过上面的方法但是平均表现出一个好的分数逆转14对比药物水平和签名的小说恐鸟。平均逆转比分是计算每个药物签名,然后使用预定的逆转分数阈值过滤。这些药物签名条件平均分数的排名基于一个提升方式。我们选择一些这类化合物代表每个感兴趣的途径。

通路富集分析

前100名最重要的基因被Auransa发动机在前面一节中描述我们的方法使用字符串的数据库进行了分析32,33DB(字符串,https://string-db.org/)。

复合采购

所有化合物研究年级化学物质来自MedChemExpress, Sigma-Aldrich, Tocris生物科学,Selleck化学物质。

Anti-SARS-CoV-2复合测试

预测化合物测试巴斯德研究所朝鲜(IPK,凭借韩国)。描述的详细的化验受雇于IPK全et al。34。简而言之,维洛细胞感染SARS-CoV-2 24 h后1小时预培养的化合物,所有这一切都是一式三份。病毒载量测定SARS-CoV-2核衣壳蛋白的免疫荧光染色。荧光表达成像使用轻歌剧(珀金埃尔默,沃尔瑟姆,MA)和分析使用一个机构专有形象矿业(IM)的软件。剂量反应曲线值是计算使用XLFit 4软件(idb,沃金,英国)。所有的集成电路50和CC50测量值在两个重复实验。

反hcov - 229 e和HCoV-OC43复合测试

人肺成纤维细胞MRC5在96孔细胞培养板在10000个细胞/在一夜之间EMEM + 10%的边后卫。第二天,培养基被从每个和化合物在EMEM + 2%的边后卫+ 0.5% DMSO补充道。每种药物测试的96板。每个板包含3井未感染的细胞没有DMSO, 3井未感染的细胞0.5% DMSO, 3井没有DMSO的感染细胞,3井与0.5% DMSO感染细胞。在每个浓度实验化合物测试一式三份。Tanespimycin bortezomib,高三尖杉酯碱进行了测试使用2µM浓度开始,8分,三倍连续稀释。与测试化合物,1小时pre-incubation后hcov - 229 e或HCoV-OC43病毒的莫伊0.01添加到文化与化合物1 h。Cell-Titer如果化验后添加额外的孵化时间与感兴趣的化合物(hcov - 229 e 96 h和HCoV-OC43 120 h)。分析读出了使用发光测量Tecan火花板读者。

CC50价值观决定通过应用非线性的发光读数从感染,compound-treated井对化合物的浓度。同样,电子商务50值是由非线性的发光读数从感染病毒,compound-treated井。非线性回归模型应用于推导的EC50和CC50值分别基于内置棱镜版本8.2.1方程(GraphPad软件,圣地亚哥,CA)。如果计算EC50 CC50的比率。

临床剂量估算的化合物

药物

Anti-Covid集成电路50

已知的药理学

临床接触

引用

拉西1

14.89μM

钙通道阻滞剂

0.003 - -0.013μM

35

Trametinib2

14.95μM

MEK1/2抑制剂

0.045μM

36

高三尖杉酯碱3

0.16μM

抑制蛋白质合成

0.046μM

37

Bortezomib4

1.39μM

可逆抑制剂的chymotrypsin-like活动26 s蛋白酶体

0.29μM

38

  1. 1Cmax后一剂4毫克/个人范围从1.6到5.7 ng / mL;分子量455.5 ng /纳摩35
  2. 2Cmax后一剂2毫克/个人27.6 ng / mL;分子量615 ng /纳摩36
  3. 3Cmax后单剂量为1.25毫克/平方米是:25.1 ng / mL;分子量545.6 ng /纳摩37
  4. 4Cmax后第一个剂量的1.3 mg / m2是:112 ng / mL;分子量384.24 ng /纳摩38