介绍gydF4y2Ba

研究物种间的分子过程驱动表型多样性,人口,和个人对于解开之间的联系是至关重要的微观和宏观进化。大多数性状多基因,这意味着他们的表型是由多个基因位点的影响gydF4y2Ba1gydF4y2Ba,gydF4y2Ba2gydF4y2Ba,gydF4y2Ba3gydF4y2Ba,gydF4y2Ba4gydF4y2Ba,gydF4y2Ba5gydF4y2Ba。然而,理解这些复杂的遗传特征是具有挑战性的。基因表达可能是一个重要的特性决定的类型影响基因对多基因特征。这是可遗传的基因表达明显动力学导致内表型变异和物种之间gydF4y2Ba6gydF4y2Ba,gydF4y2Ba7gydF4y2Ba。这些基因表达动态驱动的机制,其中包括突变cis -和trans-regulatory元素gydF4y2Ba8gydF4y2Ba,gydF4y2Ba9gydF4y2Ba,表观遗传修饰gydF4y2Ba7gydF4y2Ba,gydF4y2Ba10gydF4y2Ba,gydF4y2Ba11gydF4y2Ba,基因复制gydF4y2Ba12gydF4y2Ba,gydF4y2Ba13gydF4y2Ba,gydF4y2Ba14gydF4y2Ba受到选择压力,可能导致自适应特征在一个有机体。gydF4y2Ba

在基因表达的机制能够推动快速转变动力学是基因复制,从而导致转录丰度的增加导致内表型变异和物种之间。基因的复制,拷贝数变异(CNV),都可以用来复制滑移、不平等的交换在减数分裂过程中,基因转录的后移,全基因组的复制gydF4y2Ba15gydF4y2Ba,gydF4y2Ba16gydF4y2Ba。除了提供的基质分子进化采取行动通过多样化、CNV因基因的复制也会导致立即通过剂量增加基因表达产生的健身效果gydF4y2Ba17gydF4y2Ba。事实上,立即表型影响的潜力和重复基因突变率高表明CNV可能是一个快速适应新的生态区位的重要机制。虽然CNV的上下文中主要研究人类遗传疾病和最近的改编gydF4y2Ba18gydF4y2Ba,gydF4y2Ba19gydF4y2Ba,gydF4y2Ba20.gydF4y2Ba,越来越对个人和人口规模的CNV的作用在其他物种的生态和进化过程及其对复杂性状的影响gydF4y2Ba21gydF4y2Ba,gydF4y2Ba22gydF4y2Ba,gydF4y2Ba23gydF4y2Ba。gydF4y2Ba

复杂特征假设进化在强大的选择性压力下是毒液由于其重要的生态角色与捕食和防御gydF4y2Ba24gydF4y2Ba,gydF4y2Ba25gydF4y2Ba,gydF4y2Ba26gydF4y2Ba。毒液表型常常是一个复杂的特征,因为它依赖于多个toxin-coding基因的协调表达。这些毒素结合产生毒液配置文件是非常不同的,在和物种之间显著不同gydF4y2Ba26gydF4y2Ba,gydF4y2Ba27gydF4y2Ba。证据支持,毒素基因表达物种间的差异是一个主要贡献者毒液表型的快速发展gydF4y2Ba28gydF4y2Ba,gydF4y2Ba29日gydF4y2Ba。毒素基因家族一直假设进化通过出生和死亡模型自适应进化的这些蛋白在调节相互作用的个人健身中心营养和生存gydF4y2Ba24gydF4y2Ba,gydF4y2Ba25gydF4y2Ba。比较基因组学揭示了证据支持这一假说的有毒生物迅速积累在其基因组基因的复制:例子包括蜘蛛gydF4y2Ba30.gydF4y2Ba,gydF4y2Ba31日gydF4y2Ba、锥形蜗牛gydF4y2Ba32gydF4y2Ba,和蝎子gydF4y2Ba33gydF4y2Ba尽管也有例外,如寡妇蜘蛛gydF4y2Ba34gydF4y2Ba。gydF4y2Ba

刺丝胞动物代表一个古老的门,可能所有物种依赖毒素的猎物捕获和防御捕食者gydF4y2Ba35gydF4y2Ba。刺丝胞动物之一,海葵毒液可以说是最良好的gydF4y2Ba36gydF4y2Ba和过去的研究表明,毒素基因重复是一个重要的特性在这些生物gydF4y2Ba13gydF4y2Ba,gydF4y2Ba37gydF4y2Ba,gydF4y2Ba38gydF4y2Ba。各种海葵毒素的家庭结构和功能验证或其局部乳腺上皮细胞表达和专门的刺细胞称为nematocytesgydF4y2Ba39gydF4y2Ba,gydF4y2Ba40gydF4y2Ba。这些包括成孔Actinoporins等毒素gydF4y2Ba41gydF4y2Ba,gydF4y2Ba42gydF4y2Ba神经毒素,如Nematocyte表达蛋白3 (NEP3gydF4y2Ba43gydF4y2Ba,gydF4y2Ba44gydF4y2Ba),钠离子通道调节器(NaTxgydF4y2Ba45gydF4y2Ba,gydF4y2Ba46gydF4y2Ba),钾离子通道毒素(KTx类型1、2、3和5的家庭gydF4y2Ba36gydF4y2Ba,gydF4y2Ba43gydF4y2Ba,gydF4y2Ba47gydF4y2Ba,gydF4y2Ba48gydF4y2Ba,gydF4y2Ba49gydF4y2Ba)和蛋白酶如NEP6虾红素gydF4y2Ba44gydF4y2Ba。这些毒液组件的特性导致了系统发育与进化历史的调查,揭示这些毒素净化下家庭发展的选择gydF4y2Ba37gydF4y2Ba,gydF4y2Ba42gydF4y2Ba,gydF4y2Ba50gydF4y2Ba,除了KTx3已显示发展多元化的影响下选择gydF4y2Ba50gydF4y2Ba。是其中最良好的cnidarian毒素gydF4y2BaNv1gydF4y2Ba从河口海葵的家庭,gydF4y2BaNematostella vectensisgydF4y2Ba斯蒂芬森,1935年。位于外胚层的细胞腺gydF4y2Ba40gydF4y2Ba,钠离子通道毒素的主要组件gydF4y2Ban vectensisgydF4y2Ba毒液和此前被证明是由至少11几乎相同的编码基因的染色体gydF4y2Ba13gydF4y2Ba,gydF4y2Ba51gydF4y2Ba,gydF4y2Ba52gydF4y2Ba。此外,特定人群的变种gydF4y2BaNv1gydF4y2Ba缺席参考基因组大会已确定在特定的位置在这个物种的地理范围美国大西洋沿岸gydF4y2Ba13gydF4y2Ba并建议潜在的地点的等位基因和悬而未决的种内变异的存在gydF4y2BaNv1gydF4y2Ba基因家族。gydF4y2Ba

在这里,我们调查的演变在海葵毒素宏观和microevolutionary鳞片。我们使用的组合比较转录组和建模来理解毒液的大进化,海葵的复杂特征表明,毒素表达发展迅速在海葵没有约束的组合。我们发现在海葵,单个毒素家族主宰它们的毒液密切相关的物种之间的表型,甚至可以动态地改变或趋同进化较为疏远的物种之一。Phylogenomic分析支持,占主导地位的毒素家族经历了大规模的基因重复事件。通过调查不同人群gydF4y2Ban vectensisgydF4y2Ba使用转录组的结合、读基因组测序基因组qPCR,蛋白质组学,我们进一步表明,显著的扩张和收缩事件驱动基因表达的动态变化主要毒素甚至在微尺度。gydF4y2Ba

结果gydF4y2Ba

大进化的海葵毒素表现型gydF4y2Ba

调查大进化毒液的复杂的特点,我们采用比较转录组量化不同毒素的基因表达组件并生成毒液表达表型在海葵的物种。使用公开可用的转录组,我们确认单副本直接同源重建海葵(图之间的关系。gydF4y2Ba1gydF4y2Ba和补充数据gydF4y2Ba1gydF4y2Ba)。在音乐会,我们绘制的表达多个毒素家庭每个新创转录组组装。这包括Actinoporin, NEP3 NEP6 NaTx, KTx1, 2, 3, 5。记录每百万(TPM)映射产生的值被用于重建每个物种的毒液表达表型(无花果。gydF4y2Ba1gydF4y2Ba在提示,饼图)。通过执行祖先的国家重建(ASR)的毒液海葵(图中表达表型。gydF4y2Ba1gydF4y2Ba),我们发现NaTx毒素家族很可能占主导地位的海葵毒素在最后的共同祖先。gydF4y2Ba

图1:祖先的重建和毒液表达表型在海葵目系统发育约束。gydF4y2Ba
图1gydF4y2Ba

一个gydF4y2Ba海葵的种系发生树饼图节点代表了祖先的毒素和饼图重建提示代表了毒液表达表型。所有节点都超快的引导支持在节点> 95%。gydF4y2BaBgydF4y2Ba代表图像的三个海葵总科中phylotranscriptomic分析(Edwardsioidea -gydF4y2Ban vectensisgydF4y2Ba;Actinioidea -gydF4y2BaAulactinia veratragydF4y2Ba;Metridioidea -gydF4y2BaCalliactis息肉gydF4y2Ba)。Actinioidea和Metridioidea照片由彼得秘书长。gydF4y2BaCgydF4y2Ba模型特征进化上毒素表达强调脉冲演化过程最好的描述了海葵毒液进化。最适合模型中突出显示颜色基于加权AIC和彩色根据毒素家庭小组的关键gydF4y2Ba一个gydF4y2Ba。看到补充数据gydF4y2Ba1gydF4y2Ba对于物种的代码和引用。gydF4y2Ba

对于大多数海葵(17)29日,一个毒素家庭导致了大多数的毒液表达表型和占总数的50% >毒素表达(补充数据gydF4y2Ba2gydF4y2Ba)。在Actinioidea多样化,ASR表明KTx3进化成为占主导地位的毒素的家庭。KTx3家族的主要毒素家庭10 17 Actinioidea物种,与Actinoporin KTx1, KTx2主导四,分别和两个物种。Edwardsiid Actinioidea之外gydF4y2BaScolanthus callimorphusgydF4y2Ba高斯1853趋同进化到KTx3占支配地位的毒素。这些变化的主要毒素可以用一个模型来解释不时进化gydF4y2Ba53gydF4y2Ba,gydF4y2Ba54gydF4y2Ba。我们测试了通过模拟进化的利率作用于毒素的表达。我们发现证据表明,所有海葵毒素组件进行戏剧性的和独特的变化来解释是最好的方式快速脉冲(脉冲)而不是布朗运动(BM) Ornstein-Uhlenbeck (OU),或早期破裂(EB)模型(无花果。gydF4y2Ba1 cgydF4y2Ba)。gydF4y2Ba

理解约束作用于毒素家庭自己以及毒素的组合可以形成,我们执行系统协方差分析。广泛地说,我们的分析表明,海葵最小约束作用于毒素的组合使用来捕获猎物和抵御捕食者(图。gydF4y2Ba2gydF4y2Ba和补充数据gydF4y2Ba3gydF4y2Ba)。而我们的研究结果显示,海葵的毒液表型表达的组合相当大的灵活性毒素他们表达,有一个例外NEP3神经毒素gydF4y2Ba43gydF4y2Ba,NEP6蛋白酶的家庭gydF4y2Ba44gydF4y2Ba,在他们的表达有显著相关性。在音乐会中,这两种毒素家庭中最明显的系统发育信号表达式中所有毒素(补充数据gydF4y2Ba4gydF4y2Ba,一个强烈的信号值接近于1),提供证据表明每个毒素家族的表达更相似的密切相关的物种之一。gydF4y2Ba

图2:海葵毒素表达表型特征是一个占主导地位的毒素,通过主要脉冲演化。gydF4y2Ba
图2gydF4y2Ba

一个gydF4y2Ba毒素与重大系统协方差代表颜色组合,与那些没有显著的黑色和上下95%置信区间表示为胡须。系统协方差分析是使用马尔可夫链蒙特卡罗总共2000万次迭代。gydF4y2BaBgydF4y2Ba海葵毒素phylomorphospace集群的毒素的家庭有助于大部分的表达式。载荷对每个毒素家庭用箭头表示。gydF4y2Ba

然后,我们探索了海葵的毒液表达表型聚类系统协方差的毒素表达式使用主成分分析(PCA;无花果。gydF4y2Ba2 bgydF4y2Ba)。这个重建的phylomorphospace海葵毒液,这复杂的特征维数相对较低(补充图。gydF4y2Ba1gydF4y2Ba与两个主要组件),占大多数的变异(62%)。而我们的分析集中在转录组来自成人,RNA是来自不同的组织类型绝大多数来自多种组织类型。因此,我们测试了不同的组织影响这我们的结果通过组织类型为固定效应在我们PCOV分析和发现,这是不显著(补充数据gydF4y2Ba5gydF4y2Ba)。广泛,毒液表达表型聚在一起取决于毒素家族最高的表达,甚至在较为疏远的物种在不同的总科。虽然NEP3和NEP6显示显著的表达系统协方差,这几乎没有影响广泛的毒液表达表型聚类在海葵。此外,KTx3和NaTx是两个毒素家庭最大的载荷,这表明它们是主要的家庭定义毒液概要受雇于海葵。这些发现表明,在海葵一个占主导地位的毒素家族的主要驱动力是口述毒液表达每个物种的表型。gydF4y2Ba

完全,这些结果强调,虽然海葵的毒液是由许多不同的毒素,我们看到一个毒素家族在海葵主导着毒液表型表达。这是支持的证据表明,对于大多数毒素,系统信号作用于毒素表达较弱,毒液表达表型的维数较低时,似乎和那个小约束作用于组合的毒素表达。此外,毒素的进化表达似乎是高度动态的,经历一个快速脉冲的过程。引人注目的是,我们看到收敛毒液表达表型的变化在远亲物种,可能的结果独立适应相同的主要毒素的家庭。gydF4y2Ba

基因组结构的主要毒素的家庭gydF4y2Ba

当我们比较转录组和系统协方差分析表明,海葵毒素表达表型在很大程度上是由一个单一的毒素家族遗传结构是占主导地位的毒素家族在基因组层面需要调查。我们最近调查了海葵基因组组装使用读三个物种的测序,gydF4y2Ba海葵受压gydF4y2Ba(林奈,1758)gydF4y2Ba55gydF4y2Ba,gydF4y2Ba美国callimorphusgydF4y2Ba,gydF4y2Ban vectensisgydF4y2Ba从两个总科(Actinioidea和Edwardsioidea)。值得注意的是,我们发现的证据表明,大量的重复事件主导信号驱动一个毒素家族成为占主导地位的(图。gydF4y2Ba3gydF4y2Ba),所有三个海葵物种拥有超过15份每个各自的主要毒素基因家族。我们的系统协方差分析和比较转录组显示gydF4y2Ba年代gydF4y2Ba。gydF4y2BacallimorphusgydF4y2Ba和gydF4y2Ba一个gydF4y2Ba。gydF4y2Ba受压gydF4y2Ba,占主导地位的毒素KTx3,然而,在gydF4y2Ban vectensisgydF4y2Ba,占主导地位的毒素是NaTx。对于每一个物种,占主导地位的毒素家庭占最多的副本在所有其他毒素家庭(补充数据gydF4y2Ba6gydF4y2Ba)。而gydF4y2Ba答:受压gydF4y2Ba包含NaTx和KTx3 KTx3毒素家族经历了一系列更大的重复事件,有八个成员从NaTx家人和52 KTx3家族的成员。gydF4y2Ba

图3:Phylogenomic分析的主要毒素家族gydF4y2Ba答:受压gydF4y2Ba,gydF4y2Ban vectensisgydF4y2Ba,gydF4y2Ba美国callimorphusgydF4y2Ba。gydF4y2Ba
图3gydF4y2Ba

一个gydF4y2Ba表代表毒素遍布基因组拷贝数的支架组装。gydF4y2BaBgydF4y2Ba牛津情节代表macrosyntenic染色体之间的关系gydF4y2Ba答:受压gydF4y2Ba,gydF4y2Ban vectensisgydF4y2Ba,gydF4y2Ba美国callimorphusgydF4y2Ba。gydF4y2BaCgydF4y2Ba基于成对相似性聚类NaTx和KTx3发现的三个基因以及其他海葵物种序列(家族)的聚类分析软件gydF4y2Ba113年gydF4y2Ba。序列从gydF4y2Ba答:受压gydF4y2Ba,gydF4y2Ban vectensisgydF4y2Ba,gydF4y2Ba美国callimorphusgydF4y2Ba用不同的颜色表示。其他包括毒素从以前的工作使用gydF4y2Ba50gydF4y2Ba。KTx3和NaTx家庭表示为圆圈和三角形,分别。gydF4y2BaDgydF4y2Ba共享的NaTx进化历史和KTx3突出了一个保守半胱氨酸框架中确定成熟肽。gydF4y2Ba

接下来,我们旨在解开的进化步骤,导致放大占主导地位的家庭在海葵毒素通过调查染色体的基因位置和macrosystemic关系/支架。为此我们phylogenomic执行分析和发现macrosynteny广泛共享的三个物种(无花果。gydF4y2Ba3 bgydF4y2Ba),这证实了macrosyntenic染色体之间的关系gydF4y2BaNgydF4y2Ba。gydF4y2BavectensisgydF4y2Ba和gydF4y2Ba美国callimorphusgydF4y2Ba与之前的分析是一致的gydF4y2Ba56gydF4y2Ba。这之间尤为明显gydF4y2Ban vectensisgydF4y2Ba和gydF4y2Ba美国callimorphusgydF4y2Ba的组件利用读测序和高通量基因组染色体构象捕获产生chromosome-level组件,而gydF4y2Ba答:受压gydF4y2Ba基因组测序产生只有读。从我们的分析,我们发现15染色体之间有联系gydF4y2BaNgydF4y2Ba。gydF4y2BavectensisgydF4y2Ba和gydF4y2Ba美国callimorphusgydF4y2Ba,这些都与108支架中gydF4y2Ba答:受压gydF4y2Ba(无花果。gydF4y2Ba3 bgydF4y2Ba和补充数据gydF4y2Ba7gydF4y2Ba)。我们的分析进一步表明,虽然macrosynteny三种主要是守恒的,同线性KTx3家庭中毒素基因座gydF4y2Ba美国callimorphusgydF4y2Ba和gydF4y2Ba答:受压gydF4y2Ba或NaTx家庭gydF4y2Ban vectensisgydF4y2Ba和gydF4y2Ba答:受压gydF4y2Ba,是缺席的。这是进一步证实了探索基因和基因组序列位点和下游的毒素。相比之下,NEP3和NEP6基因家族可以看到躺在支架中这一比例macrosynteny三个基因组(补充数据gydF4y2Ba8gydF4y2Ba)。这支持进化的基因编码一些毒素家庭高度动态包括NaTx和KTx3家庭已成为主导gydF4y2Ban . vectensisgydF4y2Ba和gydF4y2Ba年代gydF4y2Ba。gydF4y2BacallimorphusgydF4y2Ba和gydF4y2Ba答:受压gydF4y2Ba。有趣的是,尽管这两个截然不同的毒素(无花果。gydF4y2Ba3 cgydF4y2Ba从家族聚类),很明显,他们可能有一个共同的进化历史,这是支持的证据表明它们共享相同的半胱氨酸框架(图。gydF4y2Ba3 dgydF4y2Ba)和一些KTx3毒素类似活动NaTx毒素gydF4y2Ba57gydF4y2Ba,gydF4y2Ba58gydF4y2Ba,gydF4y2Ba59gydF4y2Ba,gydF4y2Ba60gydF4y2Ba。因为这个可能共同进化的历史,我们也探讨是否有同线性NaTx和KTx3家庭测试之间共享一个假设的祖先NaTx / KTx3,然而,没有宏观或microsynteny被发现。这进一步表明,这些毒素家庭经历快速进化的基因组结构相比其他基因,甚至其他毒素基因。gydF4y2Ba

我们进一步探讨了分子进化的主要毒素家庭在每个物种来洞察基因重复的模式,可能是物种之间共享。在gydF4y2Ban vectensisgydF4y2Ba14的18 NaTx份份额99%序列相似性在mRNA水平和假设进化,通过串联重复并可能共同进化的结果gydF4y2BaNv1gydF4y2Ba集群gydF4y2Ba13gydF4y2Ba。在gydF4y2Ba答:受压gydF4y2Ba,四个NaTx副本被发现在一个集群中,与另外四个坐落在整个基因组,然而他们仍然分享87%的平均相似度在mRNA水平。在gydF4y2Ba年代gydF4y2Ba。gydF4y2BacallimorphusgydF4y2Ba和gydF4y2Ba答:受压gydF4y2BaKTx3份经常同时也聚集在一起,然而,他们也经历了多次易位事件。他们也不显示相同的基因均化程度的观察gydF4y2BaNv1gydF4y2Ba集群或NaTx册gydF4y2Ba答:受压gydF4y2Ba,gydF4y2Ba年代gydF4y2Ba。gydF4y2BacallimorphusgydF4y2Ba和gydF4y2Ba答:受压gydF4y2BaKTx3拷贝分享相似在mRNA水平73%和34%,分别为(补充数据gydF4y2Ba9gydF4y2Ba)。这些结果支持的放大KTx3基因家族很可能通过lineage-specific重复发生,和串联重复事件NaTx和KTx3家庭扮演着主要角色。gydF4y2Ba

总的来说,我们比较转录组和phylogenomic分析提供了深刻的见解大进化海葵的毒液。从这些分析中,我们看到一个主要在海葵毒素家族规定毒液表达表型,这发展通过快速脉冲在一个高度动态的过程,受基因重复事件。然而,目前尚不清楚这些模式如何发生在人口和个体规模和理解这个链接将提供重要的见解在海葵毒素的微进化。gydF4y2Ba

种群动态的毒液表型gydF4y2Ban vectensisgydF4y2Ba

之前的研究显示,gydF4y2Ban vectensisgydF4y2BaNaTx集群基因的整体高度相似但还特定人群的变种gydF4y2BaNv1gydF4y2Ba存在gydF4y2Ba13gydF4y2Ba。这使我们探索的种群动态gydF4y2BaNv1gydF4y2Ba聚集在gydF4y2Ban vectensisgydF4y2Ba通过执行比较转录组、基因组拷贝数定量PCR,蛋白质组学和基因组学使用读测序。gydF4y2Ba

探索微进化的毒液表型gydF4y2Ban vectensisgydF4y2Ba,我们首先需要了解其人口结构在本地地理范围北美大西洋沿岸。要做到这一点,高度完整的转录组是来自九个gydF4y2Ban vectensisgydF4y2Ba人口来自北美大西洋沿岸的位置(图gydF4y2Ba4gydF4y2Ba)。具体地说,所有的转录组进行了车身分数> 90%,除了马萨诸塞州(补充数据gydF4y2Ba10gydF4y2Ba车身= 72.2%)。2589年,单副本直接同源被确定使用OrthoFinder和用于生成一个支持最大似然系谱树(图gydF4y2Ba4 bgydF4y2Ba)。广泛地说,人口聚集根据地理位置,人口从北(麻萨诸塞州,缅因州,新罕布什尔州,新泽西,和新斯科舍省)和南(北卡罗莱纳、南卡罗来纳和佛罗里达)集群单独在一起。这个系统发育分析也支持马里兰人口,这是最常见的来源gydF4y2Ban vectensisgydF4y2Ba实验室的压力gydF4y2Ba61年gydF4y2Ba、集群更紧密地与南方人口,与前面的分析一致gydF4y2Ba62年gydF4y2Ba。差异的数量由近的地理位置也观察到,特别是人口南卡罗来纳的集群与佛罗里达比北卡罗来纳更紧密地合作。gydF4y2Ba

图4:多样性NaTx假字之间gydF4y2Ban vectensisgydF4y2Ba人群。gydF4y2Ba
图4gydF4y2Ba

一个gydF4y2Ba地图的位置取样数量在北美。等位基因多样性代表点阴谋在不同位置的大小。佛罗里达州(FL),马萨诸塞州(MA)、马里兰(MD),缅因州(我),北卡罗莱纳(数控),新罕布什尔州(NH),新泽西(NJ),新斯科舍(NS),和南卡罗莱纳(SC)。gydF4y2BaBgydF4y2Ba人口结构的gydF4y2Ban vectensisgydF4y2Ba使用最大似然树从蛋白质序列生成和存在/没有以前描述的NaTx假字gydF4y2Ban vectensisgydF4y2Ba。gydF4y2BaCgydF4y2Ba箱线图的二倍体拷贝数的估计使用qPCR从样品5个种群。所代表的中位数是大胆的水平线上下铰链代表75和25百分位数,分别。箱线图胡须扩展到最大和最小值1.5 *差(四分位范围)内上、下胡须,分别。所有单个拷贝数估计每箱线图所示。方差分析显示显著影响的人口在二倍体拷贝数(单侧检验,gydF4y2BaPgydF4y2Ba< 2 e-16;补充数据gydF4y2Ba13gydF4y2Ba)。上面的字母箱线图显示的结果Tukey-Kramer事后考验family-wise错误率控制(gydF4y2Ba一个gydF4y2Ba= 0.05),人口比较显示拷贝数差异显著(gydF4y2BaPgydF4y2Ba< 0.05;看到补充数据gydF4y2Ba14gydF4y2Ba两两比较),除非他们共享相同的信。gydF4y2BaDgydF4y2Ba火山情节代表蛋白质显著不同的丰度,衡量label-free量化(LFQ)强度、FL和数控之间。灰色圆点代表不重要的蛋白质,蓝点与重要的蛋白质gydF4y2BaPgydF4y2Ba值< 0.01,绿点与Log2折叠蛋白质的变化> 2,红点与重要的蛋白质gydF4y2BaPgydF4y2Ba价值和Log2褶皱变化。gydF4y2Ba

重建后的人口结构gydF4y2Ban vectensisgydF4y2Ba,然后,我们旨在探索毒液表型之间的人群。我们专注于NaTx基因家族的进化,这是占主导地位的毒素家族在模型中代表gydF4y2Ban vectensisgydF4y2Ba。我们比较转录组的方法确定等位变异NaTx基因家族的成员(无花果。gydF4y2Ba4gydF4y2Ba)。具体来说,我们能够捕获的变种gydF4y2BaNv1gydF4y2Ba从所有人群超过8变种捕获所有人口,除了佛罗里达样品我们只能捕获一个变体。一个可能的解释为只有一个变体在佛罗里达这个副本是高度保守的,仍然保持高拷贝数。调查的表达模式gydF4y2BaNv1gydF4y2Ba然而,在所有人群中,显示gydF4y2BaNv1gydF4y2Ba大大减少了表达与TPM在佛罗里达吗gydF4y2BaNv1gydF4y2Ba在所有人群> 500,而佛罗里达州有一个TPM五(补充数据gydF4y2Ba11个gydF4y2Ba)。表达的差异gydF4y2BaNv1gydF4y2Ba人群中进一步验证使用nCounter平台,确实显示gydF4y2BaNv1gydF4y2Ba基因表达在佛罗里达人口大大减少(补充数据gydF4y2Ba11 bgydF4y2Ba)。这个惊人的结果表明gydF4y2BaNv1gydF4y2Ba集群在佛罗里达经历了大规模的萎缩。gydF4y2Ba

虽然我们能够表示的序列的多样性gydF4y2BaNv1gydF4y2Ba在人群中,捕获的拷贝数变异gydF4y2BaNv1gydF4y2Ba超出了我们的能力比较转录组使用。这是特别重要的gydF4y2BaNv1gydF4y2Ba家庭可以包含相同的基因位点内的副本。因此,我们个人执行定量PCR的估计gydF4y2BaNv1gydF4y2Ba二倍体拷贝数,(无花果。gydF4y2Ba4摄氏度gydF4y2Ba和补充数据gydF4y2Ba12gydF4y2Ba)五人口(北卡罗莱纳、缅因州、马萨诸塞州、新罕布什尔州和新斯科舍省)。由此我们发现gydF4y2BaNv1gydF4y2Ba拷贝数范围从8到24个不同人群的基因组复制北美大西洋沿岸。我们观察到显著差异在人口平均拷贝数(方差分析,gydF4y2BaPgydF4y2Ba< 2 e-16;补充数据gydF4y2Ba13gydF4y2Ba),成对事后测试显示显著差异在所有人口对(图基HSD,gydF4y2BaPgydF4y2Ba< 0.05;补充数据gydF4y2Ba14gydF4y2Ba),除了Maine-New汉普郡的比较。平均人口拷贝数最低在缅因州,新罕布什尔州(11张)在北卡罗来纳州和最高(20张)。gydF4y2Ba

虽然基因组和转录组的测量可以提供拷贝数和基因表达水平,分别的生物学特征很大程度取决于蛋白质的合成水平基因的产物。此外,在某些情况下,蛋白质含量并不是在RNA水平直接相关,蛋白质组和转录组数据集可能会给对比图片gydF4y2Ba63年gydF4y2Ba,gydF4y2Ba64年gydF4y2Ba,gydF4y2Ba65年gydF4y2Ba。因此,我们测试了认为佛罗里达Nv1蛋白质含量大大减少使用蛋白质组学方法,比较样本来自佛罗里达州和北卡罗来纳州,最近的人口到佛罗里达,基因组数据。这一分析显示,在佛罗里达Nv1是微不足道或检测不到的水平,当使用iBAQ和label-free量化(LFQ)值。相比之下,在北卡罗来纳州Nv1测量作为第三个最丰富的蛋白质在整个蛋白质组(补充数据gydF4y2Ba15gydF4y2Ba),导致Nv1最显著不同的丰富的蛋白质之间的两个种群(无花果。gydF4y2Ba4 dgydF4y2Ba和补充数据gydF4y2Ba16gydF4y2Ba)。这个引人注目的差异不能被解释为技术限制在佛罗里达测量样本总体iBAQ和LFQ价值观相似的两种人群的大多数蛋白质,和两个蛋白质组显著相关(gydF4y2BaRgydF4y2Ba2gydF4y2Ba= 0.98;补充数据gydF4y2Ba17gydF4y2Ba和补充图。gydF4y2Ba2gydF4y2Ba)。因此,我们看到一个明确的相关性降低等位变异发现在佛罗里达州样本,减少gydF4y2BaNv1gydF4y2Ba册,在蛋白质水平和异常减少Nv1佛罗里达人口。gydF4y2Ba

轻微的变化NaTx基因家族的成员也在转录组来自不同人群。而数量却有所不同,至少所有转录组捕获的一个变体gydF4y2BaNv6gydF4y2Ba,有多达三个(图。gydF4y2Ba4 bgydF4y2Ba)。gydF4y2BaNv2gydF4y2Ba摄于所有转录组,除了佛罗里达。值得注意的是,gydF4y2BaNv3gydF4y2Ba先前确定的变体,包含一个6-bp删除改变成熟肽的n端gydF4y2Ba13gydF4y2Ba位于gydF4y2BaNv1gydF4y2Ba轨迹与其他更多不同的变体(如gydF4y2BaNv4gydF4y2Ba和gydF4y2BaNv5gydF4y2Ba外转移)gydF4y2BaNv1gydF4y2Ba轨迹gydF4y2Ba66年gydF4y2Ba。虽然gydF4y2BaNv3gydF4y2Ba不是广泛确认在我们的扩增子的分析,这可能是受到突变引物结合位点的存在揭示了我们的基因组分析。这是我们比较可能的转录组能够恢复gydF4y2BaNv3gydF4y2Ba在所有副本北人口(包括麻萨诸塞州、缅因州、新罕布什尔州和新斯科舍省)和所有其他人群的缺席。没有副本gydF4y2Ba功能的gydF4y2Ba被捕,这也符合先前的发现这个NaTx基因家族的成员表达在非常低的水平。的分布gydF4y2BaNv4gydF4y2Ba,gydF4y2BaNv5gydF4y2Ba,gydF4y2BaNv7gydF4y2Ba有好有坏,这可能是由于他们的表情被限制在生命早期阶段,母亲般地存入蛋,因此只捕获如果个体采样雌性包含蛋包gydF4y2Ba66年gydF4y2Ba。gydF4y2Ba

在这里,我们提供多个证据证实的拷贝数gydF4y2BaNv1gydF4y2BaNaTx家族成员的主要毒素gydF4y2Ban vectensisgydF4y2Ba,发展高度动态的方式在人群中,而其他毒素的家庭似乎更稳定。这是最引人注目的佛罗里达人口经历了戏剧性的收缩gydF4y2BaNv1gydF4y2Ba集群,导致几乎完全丧失gydF4y2BaNv1gydF4y2Ba信使rna和蛋白质水平。这突显出,即使是在家庭占主导地位的毒素(NaTx)层次结构存在于特定的成员(例如,gydF4y2BaNv1gydF4y2Ba集群)的主要修饰符毒液表型,他们是高度动态的进化。因此,了解基因组结构的扩张和收缩gydF4y2BaNv1gydF4y2Ba集群中gydF4y2Ban vectensisgydF4y2Ba人口是至关重要的识别机制,更为进化的主要毒素家族及其在推动作用物种内的毒液表型的变化。gydF4y2Ba

基因组的安排gydF4y2BaNv1gydF4y2Ba位点gydF4y2Ba

进一步探索的序列多样性gydF4y2BaNv1gydF4y2Ba人群中gydF4y2Ban vectensisgydF4y2Ba156年,我们进行了扩增子测序gydF4y2Ban vectensisgydF4y2Ba个人从五个位置(北卡罗莱那州、马萨诸塞州、新罕布什尔州、缅因州和新斯科舍;无花果。gydF4y2Ba5gydF4y2Ba)。这一分析显示30个不同的存在gydF4y2BaNv1gydF4y2Ba变体。这些30截然不同gydF4y2BaNv1gydF4y2Ba变异,27日也发现的转录组gydF4y2Ban vectensisgydF4y2Ba从不同的人群。在编码序列级11变异被发现广泛的跨多个不同的种群,12仅限于东北,四个在北卡罗莱纳和新泽西。这些amplicon-derived层次聚类gydF4y2BaNv1gydF4y2Ba假字DNA水平上揭示的样本组分享gydF4y2BaNv1gydF4y2Ba位点基因型,四个“核心”单可以推导出纯合个体(无花果。gydF4y2Ba5 bgydF4y2Ba)。而gydF4y2BaNv1.var1gydF4y2Ba共享所有单和确认是出现在所有转录组(佛罗里达除外),其余的假字独有一个单体型。单核心共享多个haplotype-specific假字虽然有一些变化在这些单的证据。例如,杂合的H1单体型的人拥有gydF4y2BaNv1.var5gydF4y2Ba或gydF4y2BaNv1.var7gydF4y2Ba。gydF4y2Ba

图5:基因组排列gydF4y2BaNv1gydF4y2Ba位点。gydF4y2Ba
图5gydF4y2Ba

一个gydF4y2Ba的热图gydF4y2BaNv1gydF4y2Ba假字的丰富gydF4y2Ban vectensisgydF4y2Ba样本。示例集群沿gydF4y2BaxgydF4y2Ba根据轴gydF4y2BaNv1gydF4y2Ba根据抽样人口组成和标记。gydF4y2BaNv1gydF4y2Ba假字分组的gydF4y2BaygydF4y2Ba轴根据推断单体型(H1-4)。gydF4y2BaBgydF4y2Ba基因组的安排gydF4y2BaNv1gydF4y2Ba在个人每个框代表一个轨迹gydF4y2BaNv1gydF4y2Ba假字与内部标签对应的数字标识符相关的扩增子变体。假字的颜色是根据扩增子的识别核心单体型分析(黄色= H1,红色= H2,蓝色= H3,绿色= H4,白色=共享/待定)和相应的多序列比对和氨基酸变异补充无花果所示。gydF4y2Ba3gydF4y2Ba和gydF4y2Ba4gydF4y2Ba。斜体变体标签对应于最低的扩增子变量两两距离基因变体。假基因(P1, P2, P3)和gydF4y2BaNv2gydF4y2Ba副本分别标记。基因间的距离以灰色显示,虚线表示未知距离的差距。*所有位点都显示在同一个转录方向和所有变量在每个轨迹共享相同的取向。gydF4y2Ba

单核心的分布变化的范围gydF4y2Ban vectensisgydF4y2Ba。虽然H1是出现在87 - 100%的个体从新斯科舍省,缅因州,新罕布什尔州,和马萨诸塞州,缺席北卡罗来纳州的样品(图。gydF4y2Ba5gydF4y2Ba和补充图。gydF4y2Ba5gydF4y2Ba)。相反,H4单体型只存在于所有样本北卡罗来纳州但缺席所有其他人群。gydF4y2Ba

特定的意义gydF4y2BaNv1gydF4y2Ba集群的毒液表型gydF4y2Ban vectensisgydF4y2Ba及其动态演化在人群中,我们读进行测序和组装的gydF4y2BaNv1gydF4y2Ba轨迹进行单四个人从不同人群(佛罗里达州,北卡罗莱纳、缅因州和新斯科舍省)。我们的分析取得了七个不同的单,除了最近组装的单体型gydF4y2Ban vectensisgydF4y2Ba参考基因组gydF4y2Ba56gydF4y2Ba。的七个单组装在这项研究中,六人完全组装,由单一张成读取(补充数据gydF4y2Ba18gydF4y2Ba)。的数量gydF4y2BaNv1gydF4y2Ba每单体型副本(包括假基因)范围从0到17份。这些拷贝数估计高于amplification-based分析由于引物结合位点的突变的存在一些变异(例如,gydF4y2BaNv1.var28gydF4y2Ba)。没有单一的佛罗里达州的单体型gydF4y2BaNv1gydF4y2Ba从30 kb删除复制结果相对于单份单体型(补充图。gydF4y2Ba6gydF4y2Ba)。除了佛罗里达州单,所有单分享一个假基因和一个假字(的副本gydF4y2BaNv2gydF4y2Ba)。缅因州和北卡罗来纳州H4单还共享一个假基因位点的另一端。gydF4y2Ba

组装单证实了推断的组成核心单确定的扩增子分析。的八个单(包括裁判。gydF4y2Ba56gydF4y2Ba)四个属于H3单体型,然而,显示广泛的组织的变化gydF4y2BaNv1gydF4y2Ba假字。考虑假字的安排和相关的基因间的间距,加拿大丰业扩张H3(蓝色;无花果。gydF4y2Ba5 bgydF4y2Ba通过连续的重复单一)发生gydF4y2BaNv1.var6gydF4y2Ba册,并搭配gydF4y2BaNv1.var6gydF4y2Ba- - - - - -gydF4y2BaNv1var.20gydF4y2Ba拷贝(gydF4y2BaNv1.var1gydF4y2Ba和gydF4y2BaNv1.var20gydF4y2Ba相差1 bp intronic indel /突变)。相比之下,北卡罗莱纳H3(蓝色;无花果。gydF4y2Ba5 bgydF4y2Ba)似乎已经经历了一个重复的gydF4y2BaNv1.var8gydF4y2Ba- - - - - -gydF4y2BaNv1.var6gydF4y2Ba- - - - - -gydF4y2BaNv1.var1gydF4y2Ba- - - - - -gydF4y2BaNv1.var6gydF4y2Ba四胞胎之一。gydF4y2Ba

有证据表明,转座的元素(te)有影响了gydF4y2BaNv1gydF4y2Ba轨迹是有一个大的插入位点FL262 Mutator-like元素(骡子)两端(职位60895年和76278年),暗示着骡子似的(补充数据gydF4y2Ba19gydF4y2Ba)。插入在多个基因位点和~ 15 kb的长度,这是极端的骡子似的大小分布在植物gydF4y2Ba67年gydF4y2Ba。然而,虽然TEs可以解释的插入,似乎他们不删除其他的解释gydF4y2BaNv1gydF4y2Ba轨迹。一个合理的解释与佛罗里达单相关的删除是non-b DNA结构的存在。零拷贝单体型的删除断点发生在356个基点从断点与截断gydF4y2BaNv1gydF4y2Ba在缅因州和北卡单,表明这个地区可能倾向于删除(补充图。gydF4y2Ba7gydF4y2Ba)。这个地区的断点发生在或邻近特性导致非规范(non-b) DNA结构:反向重复和保利(G)。这些结构引起基因组不稳定性和与大型删除有关人类和酵母gydF4y2Ba68年gydF4y2Ba。gydF4y2Ba

讨论gydF4y2Ba

我们的研究结果提供了一个鲜明的例子重复基因如何影响微观和宏观进化论模式将毒液表达式内表型和物种之间的海葵。与进化的特征约束作用于毒素基因在序列水平gydF4y2Ba37gydF4y2Ba,gydF4y2Ba42gydF4y2Ba,gydF4y2Ba50gydF4y2Ba,我们表明,毒素基因表达发展迅速和动态,暗示强烈选择性力量作用于毒素基因的表达。Phylogenomic分析支持,基因复制可能是下属机制占这些适应性基因表达的变化。人口规模和我们找到类似的模式表明,占主导地位的海葵毒素的模型,gydF4y2Ban vectensisgydF4y2Ba、展品极端之间的拷贝数变异种群甚至个体的染色体。gydF4y2Ba

在这里,我们调查了毒液进化海葵在生态和进化时间尺度。广泛地说,我们的研究结果表明,单一的表达毒素家族主导着毒液表达表型的海葵,他们可以转变之间,甚至在一个物种在一个高度动态的方式。建模的表达毒素家庭证实他们的进化是通过快速进化的脉冲来解释的。收敛的主要毒素是观察到的变化发生,总科发现了物种的毒液表达表型聚类在一起。自适应进化的趋同进化通常是一个标志,因此表明所需的主要毒素有一个适应的角色生态专业化。gydF4y2Ba

我们的研究结果也显示类似的毒蛇的机制gydF4y2Ba28gydF4y2Ba,gydF4y2Ba53gydF4y2Ba。在工作几年Barua &gydF4y2Ba28gydF4y2Ba,蛇的毒液表型在很大程度上是由一个占主导地位的毒素,这解释了其低维数和缺乏系统约束作用在毒液的组合。通过比较我们的结果与发现蛇我们看到,选择驾驶毒素占主导地位的家庭,而不是内在的限制,可能起主要作用在塑造海葵和蛇的毒液表型。类似的模式在锥形蜗牛,通常一个毒素总科>占总数的50% conotoxin表达式gydF4y2Ba69年gydF4y2Ba。这些主要毒素总科收敛发展高度动态的方式,密切相关的物种有不同的主要毒素gydF4y2Ba69年gydF4y2Ba。从这些结果,我们建议,鉴于毒液是一种多基因性状在许多其他有毒的动物,家庭是一个占主导地位的毒素的主要独裁者毒液表型和占主导地位的毒素的转变可能是由选择满足这些动物的生态需求。gydF4y2Ba

我们的研究结果提供的证据表明,一个毒素家族决定了表型海葵的毒液,毒液而其他组件可能更多的是间接影响。的潜在约束这phylotranscriptomic方法是假设毒素转录丰度准确地代表了毒液表型。转录丰度之间的相关性和蛋白质/肽表达一直是争论的焦点毒液gydF4y2Ba70年gydF4y2Ba,gydF4y2Ba71年gydF4y2Ba,gydF4y2Ba72年gydF4y2Ba,gydF4y2Ba73年gydF4y2Ba和更广泛的(例如,参考文献。gydF4y2Ba74年gydF4y2Ba,gydF4y2Ba75年gydF4y2Ba)。然而,我们考虑我们的转录组方法健壮的有以下三个原因:第一,前一个定量的种间蛋白质水平的研究没有发现证据缓冲毒液可能复杂化种间比较gydF4y2Ba73年gydF4y2Ba。第二,避免假阳性已知问题在转录组分析,我们实行严厉的过滤器来限制我们的分析善意海葵毒素。最后,我们的工作gydF4y2Ban vectensisgydF4y2Ba(ref。gydF4y2Ba43gydF4y2Ba;这项研究)显示强烈的毒素之间的一致性转录和蛋白质/肽丰富。gydF4y2Ba

从转录组的观察,我们可以看到相似之处与omnigenic模型是一个框架来理解复杂的多基因的结构特征分类组织复杂的特征基因为核心或外围基因。博伊尔提出的等。gydF4y2Ba1gydF4y2Ba,一个给定的价值特征在很大程度上是由几个核心基因的表达水平在相关组织,而基因中的可能更多的是间接影响表型。我们看到一个相关性omnigenic模型和毒液表型表达单一主导毒素作为核心基因家族,直接影响到毒液表达表型。其他毒素基因,然而,像外围基因,影响毒液表达表型更间接的方式和可能作用占主导地位的增效剂毒素。这曾被各种吐蛇所示磷脂酶A2 (PLA2)强化主导的毒素,细胞毒性三指毒素占大多数的蛋白质丰富它们的毒液gydF4y2Ba76年gydF4y2Ba。因此,当所有毒素成分的毒液可能导致复杂性状的遗传方差,核心基因的主要修饰符毒液表现型。值得注意的是,然而,毒液omnigenic模型并不完全符合作为一个复杂的特征。毒液是一种相对独特的特征,使用的有毒的鸡尾酒毒液的有机体是一个终端组件生产和毒素不太可能影响这个复杂的通路通过反馈回路,而omnigenic模型概念化理解网络的基因如何影响一个复杂的特征。应用这种毒液表型,这需要探索网络参与毒液生产。为了揭开这海葵,比较需要nematocytes和腺体细胞的转录组。然而,应用omnigenic模型来理解毒液鸡尾酒本身的表型仍然给了我们深入理解复杂的特征分类等不同的毒素的家庭集团核心和外围基因。gydF4y2Ba

近期作品是解开基因表达的影响健康的有机体。例如,在核苷酸水平变化驱动基因表达的变化显示是健身景观的主要修饰符的蛋白编码基因实验装置使用模型酵母gydF4y2Ba酿酒酵母gydF4y2Ba77年gydF4y2Ba。这些发现表明,有更大的约束作用于高表达基因的序列和强调,基因表达水平和序列进化都是相互关联的gydF4y2Ba77年gydF4y2Ba。最近的一项突破性的研究梦露et al。gydF4y2Ba78年gydF4y2Ba洞察机制负责提供证据证明高表达基因受到约束的明显特征。作者发现基因的差异是必不可少的突变率37%的减少gydF4y2Ba拟南芥gydF4y2Ba这降低了基本基因突变率与外遗传性特征有关,如H3K4me1gydF4y2Ba78年gydF4y2Ba。毒液的进化,我们怀疑毒素的家庭之间的区别被分为核心基因或外围基因可能具有重要意义的选择压力作用在序列水平。这是由以前的工作在不同人群的东部菱形斑纹响尾蛇(gydF4y2BaCrotalus adamanteusgydF4y2Ba),表明毒素基因表达动态,不积极的选择在核苷酸水平,是这些动物的机制来克服阻力的特定人群猎物,突出生态影响和选择压力作用于毒素基因表达水平gydF4y2Ba79年gydF4y2Ba。主要提出了毒素对广泛的生态功能是必要的(如一般的猎物捕获),而外围毒素可能更多prey-specific功能和特点是有更大的散度的表达式和氨基酸序列的水平gydF4y2Ba80年gydF4y2Ba,gydF4y2Ba81年gydF4y2Ba,gydF4y2Ba82年gydF4y2Ba。gydF4y2Ba

结合我们的研究结果,我们报告的主要毒素决定了毒液表型海葵,假设这种现象可能会共享在海葵,蛇和锥形蜗牛以及其他有毒的组,表明这是一个趋势在远亲血统进化收敛。我们认为,基因重复是构成这一过程的机制。gydF4y2Ba

基因重复是一个重要的机制产生了表型变异超过生态和进化时间尺度通过基因表达的改变和多样化的变体gydF4y2Ba83年gydF4y2Ba,gydF4y2Ba84年gydF4y2Ba,gydF4y2Ba85年gydF4y2Ba。我们发现基因复制在塑造过程中发挥作用的毒液表型海葵在微观和宏观进化。维护集群复制基因的假设发生是由于守恒的表达调控。毒素基因、高度重复的毒素留存在集群可能导致增加生产毒素蛋白的转录许多份高度相似或相同的基因gydF4y2Ba12gydF4y2Ba。Nv1而言,这是支持的测量在我们当前的转录组和蛋白质组水平研究和先前发表的作品gydF4y2Ba43gydF4y2Ba。然而,转录的gydF4y2BaNv1gydF4y2Ba在生命周期中明显不同gydF4y2Ba43gydF4y2Ba在应对各种环境变化如温度和盐度gydF4y2Ba86年gydF4y2Ba光和周期性gydF4y2Ba87年gydF4y2Ba。环境引起的表达gydF4y2BaNv1gydF4y2Ba根据不同的地理起源和转录变异与CNV,表明基因剂量是适应当地的潜在机制gydF4y2Ba86年gydF4y2Ba(补充图。gydF4y2Ba8gydF4y2Ba)。这些结果与蛇myotoxins一致,提出了选择行为增加表达式而不是提供多样性通过永久杂合子或multiallelic多元化选择模型gydF4y2Ba79年gydF4y2Ba。然而,这些myotoxin分析排除外显子序列的变化负责的信号肽裂解的成熟的毒素。虽然我们也观察到低多样性的成熟的毒素,与裁判一致。gydF4y2Ba13gydF4y2Ba跨多个人口,我们的分析显示信号和非同义变异propart肽序列。虽然序列变异的功能作用在这些地区毒液基因尚未探索,氨基酸组成和布置在信号和propart肽已被证明改变易位,翻译和乳沟效率gydF4y2Ba88年gydF4y2Ba。因此,这个区域的基因变异可能大概修改翻译后的监管gydF4y2BaNv1gydF4y2Ba。gydF4y2Ba

佛罗里达单提出重要的问题关于他们的起源和这些种群的生态。单体型没有的存在gydF4y2BaNv1gydF4y2Ba轨迹表明,gydF4y2BaNv1gydF4y2Ba表示“不”比如可能出现在野外gydF4y2Ban vectensisgydF4y2Ba人群。的gydF4y2BaNv1gydF4y2Ba表示“不”单体型可能反映了一种现象类似于蛇,a - b二分法观察到两个不同类型的毒液在很大程度上存在相互排斥的态度gydF4y2Ba89年gydF4y2Ba。在这种情况下,佛罗里达个人可能弥补低gydF4y2BaNv1gydF4y2Ba通过扩大其他毒素基因副本。但是,我们发现没有证据表明补充基因家族在11其他已知的扩张gydF4y2Ban vectensisgydF4y2Ba毒素基因(补充图。gydF4y2Ba9gydF4y2Ba)。另外,低拷贝数与健身的佛罗里达个人可能导致成本高的基因表达有关。毒液生产有重要的代谢消耗gydF4y2Ban vectensisgydF4y2Ba86年gydF4y2Ba和gydF4y2BaNv1gydF4y2Ba表达了近两个数量级高于其他毒素呢gydF4y2Ba43gydF4y2Ba。因此,在人群中把毒液能力降低的温度上限物种范围可能反映了毒液的代谢菌株生产。然而,夏季气温在南卡罗来纳州生境相对类似于佛罗里达的栖息地。相反,我们建议等大规模减少毒素生产观察到这里至少应该与一些差异和/或捕食者猎物佛罗里达和南卡罗来纳之间的成分和丰富的栖息地丧失防御或能力之前用毒液可以是非常有害的。gydF4y2Ba

假字的排他性表明特定的单体型复合当代单之间不发生或很少足够,这是超出了我们与这些样品检测的局限性。观察到缺乏重组似乎并不源于缺乏杂合的个人,因为他们出现在所有人群,尽管如此,重要的是要注意,可能发生但其患病率之间的复合当代单体型可能会受到其他因素的影响如选择。然而,这种缺乏证据之间的重组核心单帮助提供洞察在单管理扩张和收缩的机制。我们看到大量的拷贝数变异,成分,和组织内的假字单包括单线态的串联重复,电子对,成套的gydF4y2BaNv1gydF4y2Ba假字(补充图。gydF4y2Ba10gydF4y2Ba)。此外,不同的假字表明,多个独立的扩张扩张事件可能发生在相同的轨迹。的扩张和收缩gydF4y2BaNv1gydF4y2Ba在核心单假字gydF4y2Ban vectensisgydF4y2Ba可以由non-allelic同源重组(NAHR)或复制滑移。NAHR通常与基因拷贝数异变有关,包括毒素基因,和在一个gydF4y2BaNv1gydF4y2Ba单体型,有足够的基质NAHR地区高序列同源性扩展在> 300个基点。转座因子的蛇,已经被提议作为NAHR衬底gydF4y2Ba90年gydF4y2Ba,gydF4y2Ba91年gydF4y2Ba;然而,这似乎没有理由gydF4y2BaNv1gydF4y2Ba轨迹内te是很大程度上缺席gydF4y2BaNv1gydF4y2Ba轨迹。如果NAHR机制驱动的扩张和收缩gydF4y2BaNv1gydF4y2Ba单,目前尚不清楚为什么它不会发生在单因为足够NAHR衬底之间明显的单体型尽管存在haplotype-specific假字。另一种假说是,扩张和收缩的轨迹是向后复制滑移的结果gydF4y2Ba92年gydF4y2Ba。我们建议这种机制更有可能负责的串联重复gydF4y2BaNv1gydF4y2Ba轨迹有足够的衬底,重复的大小与过去的观察是一致的复制滑移,和重要的是,将保持强劲的单体型结构。gydF4y2Ba

的存在gydF4y2BaNv1.var12gydF4y2Ba佛罗里达的单份单体型表明它是最核心单体型H3密切相关。然而,考虑到这个副本不是末端的轨迹,这表明,即使是单份佛罗里达单体型至少两个突变步骤从其最近的亲戚,需要进一步探索在人群中间单在美国东南部(例如,格鲁吉亚)。的基因组上下文的分析gydF4y2BaNv1gydF4y2Ba表明NAHR轨迹在佛罗里达单体型不太可能造成这些极端收缩(补充图。gydF4y2Ba6gydF4y2Ba)和其他进程表明,参与的演变gydF4y2BaNv1gydF4y2Ba轨迹。gydF4y2Ba

的同质性gydF4y2BaNv1gydF4y2Ba基因在基因簇曾被假设保持重复基因的序列相似性,通过协同进化gydF4y2Ba13gydF4y2Ba。随后的分析gydF4y2BaNv1gydF4y2Ba转移的集群——假字,应计比例更多的序列差异,进一步支持了假设的共同进化gydF4y2BaNv1gydF4y2Ba集群gydF4y2Ba66年gydF4y2Ba。毒素基因在其他动物也显示模式lineage-specific造成的高度相似的基因重复事件gydF4y2Ba13gydF4y2Ba,gydF4y2Ba38gydF4y2Ba,这表明共同进化在毒素的扩张可能是常见的家庭。在这里,共同进化的证据gydF4y2BaNv1gydF4y2Ba轨迹是粉碎了我们的空间组织的分析gydF4y2BaNv1gydF4y2Ba集群中的基因。首先,尽管当前和过去的基因组参考单程序集包含一个数字过多序列,这并不是所有的的一个特性gydF4y2BaNv1gydF4y2Ba单体型。第二,串联排列的假字组(紧身衣,四胞胎)与一致的基因间的间距可能意味着一些相似的位点是由于最近复制保留祖先的进化历史位点之前复制而不是数组的均质化。gydF4y2Ba

另一个共同进化的轨迹或额外的假设是生灭模型,提出了包括其他毒素基因gydF4y2BaNv1gydF4y2Ba假字,躲过了gydF4y2BaNv1gydF4y2Ba轨迹gydF4y2Ba66年gydF4y2Ba。这里,通过重复产生新基因副本复制一些基因组中保留副本,而其他人成为非功能性通过突变或删除gydF4y2Ba93年gydF4y2Ba。我们的组成和空间组织的分析gydF4y2BaNv1gydF4y2Ba展示重复重复的基因和基因对基因,为出生过程提供支持。此外,我们还观察到假基因高亮显示,并非所有的基因重复后留存。然而,重要的是要注意,他们的数量是非常小的相比似乎功能副本。由于缺乏一个祖先序列的情况下,不可能最终决定基因损失与收益的范围,然而,单副本gydF4y2BaNv1gydF4y2Ba表示“不”在佛罗里达单可以代表快速基因死亡的过程。这将符合其他毒素基因家族大缺失的基因已经被发现的地方gydF4y2Ba91年gydF4y2Ba。gydF4y2Ba

总的来说,我们的观察在宏观和microevolutionary时间表表明一个毒素家族决定了复杂的毒液表型在海葵。基因重复是毒素家庭成为主要通过增加基因表达的过程,这个过程是高度动态的导致的快速进化毒液表型不同的物种。占主导地位的毒素家族的基因高流动率发现即使在物种,进一步表明强大的选择性力量作用于毒素基因的表达。最后,我们看到一个类似的趋势在其他有毒的物种,我们假设基因duplication-driven主导地位由一个毒素家族是一个基本的过程形成的毒液表型。gydF4y2Ba

方法gydF4y2Ba

PhylotranscriptomicsgydF4y2Ba

我们从29海葵物种转录组分析,跨越三个五Actiniarian总科(Actinioidea, Edwardsioidea, Metrioidea)。这些转录组采样来自多个组织或触角从NCBI SRA下载使用FASTQ-DUMP SRA工具包。生读检索质量进行评估并使用Trimmomatic修剪gydF4y2Ba94年gydF4y2Ba。三一是用来组装转录组新创的过滤生读gydF4y2Ba95年gydF4y2Ba。车身(v4)被用来验证转录组的质量和完整性gydF4y2Ba96年gydF4y2Ba。记录相应的毒素被确定使用先前建立的方法gydF4y2Ba37gydF4y2Ba,然后手动策划。简言之,建立个开放式框架编码蛋白质的成绩单从每个转录组被确认使用ORFfinder (gydF4y2Bahttps://www.ncbi.nlm.nih.gov/orffinder/gydF4y2Ba)和BLASTp (gydF4y2BaEgydF4y2Ba值1 e-01)对swiss-prot数据库执行。前命中海葵毒素Tox-Prot数据库中的特征gydF4y2Ba97年gydF4y2Ba被保留,用于确定一个信号肽的存在使用SignalP (v5.0吗gydF4y2Ba98年gydF4y2Ba)。这些序列被毒素家庭和对齐的使用特点gydF4y2Ba99年gydF4y2Ba只保留那些与守恒的半胱氨酸框架残留至关重要。毒素家庭用于分析只包括那些功能特点,在多个海葵毒素种类或显示本地化毒液产生细胞使用多个实验方法。gydF4y2Ba

毒素表达数据使用软件生成杠杆在三一包(v > 2.2gydF4y2BaOne hundred.gydF4y2Ba)。这包括个人读被映射回参考新创转录组组件独立使用Bowtie2每个物种gydF4y2Ba101年gydF4y2Ba使用RSEM,丰度估计gydF4y2Ba102年gydF4y2Ba。规范化的丰度估计的记录计算和修正长度生成TPM值。最后,我们计算了每个毒素累积TPM值生成家庭和毒液表型比例,每个家庭的贡献。gydF4y2Ba

成绩单与TPM值大于零保留,他们的开放框架使用ORFfinder检测(gydF4y2Bahttps://www.ncbi.nlm.nih.gov/orffinder/gydF4y2Ba)。个开放式框架编码蛋白质> 100个氨基酸长度被保留和冗余序列相似度> 88%被生产使用CD-HIT 29转录组的预测蛋白质组gydF4y2Ba103年gydF4y2Ba。gydF4y2Ba

单副本直接同源被确定使用钻石Orthofinder包内gydF4y2Ba104年gydF4y2Ba。这个确认了138个单副本直接同源,单独使用MAFFT对齐gydF4y2Ba99年gydF4y2Ba并使用Pal2Nal核苷酸排列生成使用编码序列gydF4y2Ba105年gydF4y2Ba。对齐直接同源连接,导入IQ-TREE确定进化的最佳模型gydF4y2Ba106年gydF4y2Ba。JTT模型与γ异质性,不变的网站,和经验选择密码子频率,最大似然树生成使用1000超速引导迭代。超度量树生成中使用校准最大似然树Chronos函数R包猿使用根集的最小和最大年龄424和6.08亿年前gydF4y2Ba107年gydF4y2Ba,gydF4y2Ba108年gydF4y2Ba。不同的校准模型进行了测试,包括相关的、离散的、与离散模型和放松模型,确定最适合。gydF4y2Ba

系统协方差分析gydF4y2Ba

主成分分析是根据参考执行。gydF4y2Ba28gydF4y2Ba使用MCMCglmm R包gydF4y2Ba109年gydF4y2Ba多变量模型和毒素的家庭作为响应变量使用。使用2000万次迭代,包括燃烧和稀疏值的100万年和1500年,分别。系统信号决心如前所述gydF4y2Ba28gydF4y2Ba,gydF4y2Ba110年gydF4y2Ba。用主成分分析获取系统MCMCglmm产生的协方差分析。鉴于海葵有毒液分散系统,我们测试是否组织类型用于生成原始读取显著影响系统的效果gydF4y2Ba25gydF4y2Ba,gydF4y2Ba26gydF4y2Ba。gydF4y2Ba

建模的祖先进化的状态和模式作用于海葵毒液gydF4y2Ba

R包表面和pulsR进化的模型被用来测试gydF4y2Ba111年gydF4y2Ba。使用表面表型的证据收敛性进行了测试。pulsR包被用来测试毒液表达表型的进化通过进化模型增量或脉冲演化建模使用征收过程gydF4y2Ba54gydF4y2Ba。祖先的毒液表达表型被重新使用gydF4y2BafastAncgydF4y2BaPhytools包中gydF4y2Ba112年gydF4y2Ba。gydF4y2Ba

宏观和microsyntenygydF4y2Ba

同源染色体确定macrosynteny三个基因组中被发现。这是通过识别3767单副本直接同源使用蛋白质从所有三个基因组注释。的基因组gydF4y2Ban vectensisgydF4y2Ba,gydF4y2Ba美国callimorphusgydF4y2Ba和gydF4y2Ba答:受压gydF4y2Ba都是追究NaTx和KTx3毒素的存在。毒素从这些基因被确定使用记录之前组装使用三一和映射到基因组Splign使用在线软件(gydF4y2Bahttps://www.ncbi.nlm.nih.gov/sutils/splign/splign.cgigydF4y2Ba)。单副本直接同源的染色体位置生成一个比较广泛的macrosyntenic海葵中染色体基因组的地图。microsynteny邻近NaTx / KTx3位点研究用咩咩的叫声从30 kb上游和下游的位点以及比较3蛋白编码基因上游和下游NaTx / KTx3位点。NaTx / KTx3确认副本从三个物种的基因组与公开可用的集群复制之前用于进化分析gydF4y2Ba50gydF4y2Ba,利用宗族软件gydF4y2Ba113年gydF4y2Ba默认设置和300000发子弹。gydF4y2Ba

人口转录组gydF4y2Ba

动物集合gydF4y2Ba

成人gydF4y2Ban vectensisgydF4y2Ba收集从河口沿着美国和加拿大的大西洋海岸。我们收集了20个人五个位置(新月海滩,新斯科舍;中美合作所,缅因州;沃利斯沙,新罕布什尔州;马萨诸塞州Sippewissett;英尺。费舍尔,北卡罗来纳州)2016年3月,和一个额外的10个人/月从三个位置(中美合作所,缅因州;沃利斯金沙,新罕布什尔州;马萨诸塞州Sippewissett)在2016年6月和9月。个人存储在RNAlater并存储在−20°C之前核酸提取qPCR和扩增子的分析。在每个集合,额外的个人被运送到了北卡罗来纳大学夏洛特和在实验室培养的标准实验室条件下(15‰部分人工海水,室温下,美联储刚孵化的卤虫每周2 - 3次)。 In addition, eight adultn vectensisgydF4y2Ba收集附近的圣奥古斯汀,佛罗里达被卢卡斯Schare请提供(巴塞尔大学)。从这些实验室种群,我们选择了四个人海葵读测序克隆生长线;单一个人新斯科舍省,缅因州,北卡罗莱纳和佛罗里达是种植和一分为二的生成线。gydF4y2Ba

调查群体比较的毒液gydF4y2Ban vectensisgydF4y2Ba转录组是执行。收集多个个体从九个地点在北美。这包括上面提到的相同的位置在佛罗里达州,麻萨诸塞州,缅因州,北卡罗来纳州,新罕布什尔州,新斯科舍省以及新泽西州(Brigantine),马里兰(罗德河),和南卡罗莱纳(乔治城)。个人从这些位置被带回实验室,可以适应了两周。gydF4y2Ba

总RNA提取的三个标本/网站从九个不同地点使用RNeasy迷你包(美国试剂盒)。RNA提取的质量和完整性评估使用生物分析仪2100(美国安捷伦)使用RNA纳米芯片(RIN > 8)。测序图书馆准备使用Kapa滞留mRNA-seq工具包(瑞士罗氏公司)和测序的Illumina公司HiSeq 4000用150个基点paired-end化学杜克中心执行基因组和计算生物学(达勒姆、数控、美国)。从每个人清洗使用Trimmomatic生读gydF4y2Ba94年gydF4y2Ba仅保留高质量的读取和删除非生物序列和组装成9使用三一2.6.6转录组gydF4y2Ba95年gydF4y2Ba。评估新创转录组的完整性,车身(v3.0)上执行的每个转录组来评估每个装配的完整性,通过确定全身的比例在每个转录组序列对应于一组守恒的后生动物直接同源gydF4y2Ba114年gydF4y2Ba。gydF4y2Ba

比较转录组进行重建的系统发育关系gydF4y2Ban vectensisgydF4y2Ba人口在北美。对于每个转录组,个开放式框架被确定使用使用Transeq ORFfinder和翻译。冗余序列使用CD-HIT > 88%序列相似性被移除gydF4y2Ba103年gydF4y2Ba。> 100个氨基酸的蛋白质序列的长度是用来识别单副本使用OrthoFinder直接同源gydF4y2Ba115年gydF4y2Ba和杠杆使用钻石gydF4y2Ba116年gydF4y2Ba。此外,我们补充道gydF4y2Ba美国callimorphusgydF4y2Ba和gydF4y2Ba爱德华菌属carneagydF4y2Ba作为外围集团gydF4y2Ban vectensisgydF4y2Ba人群。这导致了2589单副本直接同源11转录组之间共享。为每个单副本直接同源蛋白质序列是单独使用MAFFT对齐gydF4y2Ba99年gydF4y2Ba。然后连接并导入到IQ-TREE蛋白质的排列中,并使用ModelFinder进化的最佳模式选择gydF4y2Ba106年gydF4y2Ba,后是指网站频率模型被用来减少朗布兰奇景点文物gydF4y2Ba117年gydF4y2Ba。最大似然系统发育树生成使用1000超速引导迭代。gydF4y2Ba

变化的毒素NaTx基因家族gydF4y2Ban vectensisgydF4y2Ba(gydF4y2BaNv1gydF4y2Ba,gydF4y2BaNv2gydF4y2Ba,gydF4y2BaNv3gydF4y2Ba,gydF4y2BaNv4gydF4y2Ba,gydF4y2BaNv5gydF4y2Ba,gydF4y2BaNv6gydF4y2Ba,gydF4y2BaNv7gydF4y2Ba)研究了在不同人群中使用多个方法。最初,BLASTp进行识别毒素对自定义使用子从转录组数据库的所有已知的序列组成gydF4y2BaNv1gydF4y2Ba基因家族。序列与一个重要的打击(gydF4y2BaEgydF4y2Ba值1 e-05)然后手动策划确定的存在信号肽和守恒的半胱氨酸框架。此外,gydF4y2BaNv1gydF4y2Ba副本之前报道称大量复制(至少有10份之前报道)和高度同质的基因组gydF4y2Ban vectensisgydF4y2Ba13gydF4y2Ba。由于这些原因,需要额外的方法来捕获这些有限的变化gydF4y2BaNv1gydF4y2Ba副本的数量。为了实现这一点,清理原始读取映射使用Bowtie2插件在三一使用默认设置gydF4y2Ba95年gydF4y2Ba,gydF4y2Ba101年gydF4y2Ba到gydF4y2Ban vectensisgydF4y2Ba基因模型gydF4y2BaNv1gydF4y2Ba减少到一个副本gydF4y2Ba86年gydF4y2Ba。Paired-end读取映射到gydF4y2BaNv1gydF4y2Ba然后提取并一致吗gydF4y2BaNv1gydF4y2Ba使用MAFFT基因模型gydF4y2Ba99年gydF4y2Ba,一个新的共识gydF4y2BaNv1gydF4y2Ba序列为每个映射生成paired-end阅读使用缺点浮雕。相同的gydF4y2BaNv1gydF4y2Ba序列然后使用CD-HIT-EST集群gydF4y2Ba103年gydF4y2Ba只有顶部最丰富的序列,序列占总数的70%或至少10相同副本留存。佛罗里达州的样本是一个例外,只有最丰富的序列被保留,因为它有四个完全相同的副本。的开放框架被确认和冗余编码序列删除给等位变异的表现gydF4y2BaNv1gydF4y2Ba在不同的人群。获得的等位变异gydF4y2BaNv3gydF4y2Ba,有一个映射paired-end读取gydF4y2BaNv3gydF4y2Ba签名(AAACGCGGCTTTGCT KRGFA编码,而不是gydF4y2BaNv1gydF4y2BaAAACGCGGCATTCCT为KRGIP)提取和编码一致gydF4y2BaNv3gydF4y2Ba编码序列使用MAFFTgydF4y2Ba99年gydF4y2Ba。最丰富的共识序列,序列占总数的70%或至少10相同副本保留,删除和冗余编码序列。gydF4y2Ba

人口蛋白质组学gydF4y2Ba

半定量使用成人MS / MS分析(四个复制,每个由3个人)来自北卡罗莱纳和佛罗里达。样本快速冷冻和细胞溶解使用8 M尿素和400毫米碳酸氢铵的解决方案。细胞溶解样本离心机(22000×gydF4y2BaggydF4y2Ba20分钟4°C)和上层的收集。蛋白质浓度测定BCA蛋白质化验设备(热费希尔科学)。gydF4y2Ba

MS分析样品制备gydF4y2Ba

10毫克的蛋白质溶解在100μl 8 M尿素,10毫米德勤,25毫米Tris-HCl pH值8.0为30分钟22°C。添加碘乙酰胺(55毫米),其次是孵化30分钟(22°C,在黑暗中)。8卷的样本稀释25毫米Tris-HCl pH值8.0之后,添加sequencing-grade修改胰蛋白酶(Promega Corp .)、麦迪逊、WI)(0.4μg /样本)和孵化一夜之间在37°C。缩氨酸被添加0.4%甲酸酸化,转移到使用C18自制小贴士脱盐阶段。肽的浓度是由吸光度在280 nm和0.3µg肽被注入到质谱仪。gydF4y2Ba

nanoLC-MS / MS分析gydF4y2Ba

nanoLC-MS / MS分析在裁判表现如前所述。gydF4y2Ba118年gydF4y2Ba除了肽溶解在0.1%甲酸分离没有陷阱列在一个80分钟乙腈梯度运行0.3μl /分钟的流量反向阶段25-cm-long C18柱(75μm ID、2μm, 100 a,热PepMapRSLC)。中描述的仪器设置裁判。gydF4y2Ba119年gydF4y2Ba。gydF4y2Ba

女士的数据分析gydF4y2Ba

使用MaxQuant质谱数据处理计算平台,2.0.3.0版本。峰列表是对一个NVE FASTA序列数据库搜索(gydF4y2Bahttps://figshare.com/articles/Nematostella_vectensis_transcriptome_and_gene_models_v2_0/807696gydF4y2Ba)。搜索包括半胱氨酸carbamidomethylation固定修改,氨基端乙酰化作用,氧化蛋氨酸作为变量的修改,允许两miscleavages。使用“match-between-runs”选项。肽链的长度至少7个氨基酸被认为和所需的罗斯福是在肽和蛋白质水平的1%。相对蛋白质量化MaxQuant使用LFQ执行算法gydF4y2Ba120年gydF4y2Ba。MaxLFQ允许精确proteome-wide label-free量化延迟正常化和最大肽比例提取。gydF4y2Ba

统计分析(gydF4y2BangydF4y2Ba= 4)都使用了珀尔修斯统计软件包,1.6.2.2版本gydF4y2Ba121年gydF4y2Ba。只有那些蛋白质的至少三个有效LFQ值获得至少在一个样本组被接受和log2转变。通过学生的统计分析gydF4y2BatgydF4y2Ba测试和permutation-based罗斯福(gydF4y2BaPgydF4y2Ba值< 0.05)。这个过滤器的应用后,一个随机的值代替蛋白质的LFQ不能决定(珀尔修斯的“污名”功能)。估算值的范围在10%的中值样本中所有的蛋白质并允许的计算gydF4y2BaPgydF4y2Ba值。测试如果蛋白质组相比,我们在佛罗里达州和北卡罗来纳州之间进行线性回归样本。蛋白质与非零LFQ值至少在一个示例使用了每个人口每百万。gydF4y2Ba

人口基因组学gydF4y2Ba

量化Nv1拷贝数gydF4y2Ba

我们使用定量PCR确定的数量gydF4y2BaNv1gydF4y2Ba册个人收集从每个位置使用水解probe-based定量PCR。DNA的海葵从每个位置被隔离AllPrep DNA / RNA工具包(试剂盒)使用制造商的协议。引物和水解调查设计gydF4y2BaNv1gydF4y2Ba和gydF4y2Ba过氧化氢酶gydF4y2Ba使用Primer3gydF4y2Ba122年gydF4y2Ba。每个基因的水解探测器包含不同的荧光团除了3 '和内部饮料(gydF4y2BaNv1gydF4y2Ba= 5 ' Cy5 /道/ 3 ' IBRQ;猫= 5 ' 6-FAM /禅/ 3 ' IBFQ)。放大进行了应用生物系统公司7500快速实时PCR系统使用Luna通用探针组合(内)。我们评估的性能qPCR引物和探针使用DNA浓度梯度生成0.1 - -100.0 ng /反应单基因反应以及多路复用的反应。的效率基因化验都是推荐的范围内(90 - 110%),可比在浓度梯度和一致的单一和多路之间的反应。因此,我们放大gydF4y2Ba过氧化氢酶gydF4y2Ba和gydF4y2BaNv1gydF4y2Ba为每个样本一式多路复用的反应,每个96孔板包含所有人群样本。此外,每个板包含一式三份的反应一个参考样本的已知拷贝数从佛罗里达(二倍体拷贝数= 1;来自基因组组装),没有模板控制(NTC)和两个样品监测板块之间的可变性。二倍体拷贝数估计使用∆∆Ct方法与过氧化氢酶单副本控制基因和已知拷贝数的佛罗里达州的样本作为我们的参考样品。在任何ntc没有放大观察。gydF4y2Ba

Cq值自动测定的应用生物系统公司软件。我们过滤个人从Cq的qPCR结果值范围之外的基因用于效率评估(两个人),和过滤的个人反应的Cq偏差值超过0.2 Cq之间任何一式三份反应的基因(6/549)的反应。当我们使用多路复用反应,意味着∆Ct计算的均值∆Ct在个体反应。我们进行了双向方差分析(二倍体拷贝数~人口*板)在出租车使用II型包R SS(占不平衡设计)来测试对二倍体人口的影响gydF4y2BaNv1gydF4y2Ba拷贝数,占任何潜在的批处理效果。的方差分析测试结果显示无显著影响板或population-by-plate拷贝数的估计。图基HSD事后测试(α= 0.05)进行使用agricolae包gydF4y2Ba123年gydF4y2Ba。gydF4y2Ba

扩增和测序gydF4y2BaNv1gydF4y2Ba

我们设计了引物扩增gydF4y2BaNv1gydF4y2Ba位点在基因组DNA序列分析的Illumina公司MiSeq。引物设计放大的完整编码序列gydF4y2BaNv1gydF4y2Ba和最小化不匹配之间确定的snpgydF4y2BaNv1gydF4y2Ba变体。引物包含适配器过剩Nextera索引。pcr进行与HiFi HotStart ReadyMix (Kapa生物科学)使用下列条件:95°c - 3分钟;8 x(95°正在,55°正在年代,72°正在s), 72°c - 5分钟。PCR产物纯化了Ampure XP珠子(贝克曼犁刀)。预期的成功放大产品尺寸被凝胶电泳验证。扩增子从每个样本被量子位(热费希尔科学)量化规范化。相同浓度的每个样品池使用MiSeq v3与PhiX 5%测序试剂盒(600次)。我们使用mothur v1.44.3gydF4y2Ba124年gydF4y2Ba加入重叠读取叠连群,随后被过滤删除外的扩增子gydF4y2BaNv1gydF4y2Ba规模预期(300 - 500个基点)和模棱两可的基地。Cutadapt v2.6gydF4y2Ba125年gydF4y2Ba随后被用来去除引物序列。我们随机抽样14800读FASTA文件的深度,有四个样品从未来分析由于读取不足。为了区分生物序列变异和方法论的工件(例如,PCR和测序错误),我们确定了变量的列表基于最小样本读大量的100年,在不止一个人。相对丰富的热图跨样本生成使用ComplexHeatmap包变体gydF4y2Ba126年gydF4y2Bar .分层聚类的样本进行用斯皮尔曼等级相关测量的距离。gydF4y2Ba

PacBio和纳米孔测序gydF4y2Ba

高质量的DNA提取单个克隆线从四个地理位置(新斯科舍省,缅因州,北卡罗莱纳和佛罗里达)使用先前描述的提取协议gydF4y2Ba127年gydF4y2Ba。这个协议是用于高分子量DNA的组织在液氮研磨,减少一个小时的孵育时间和温度42°C,增加洗脱时间24小时,整个协议和wide-bore技巧的使用。gydF4y2Ba

新斯科舍省和佛罗里达海葵我们测序DNA单基因型与PacBio技术。DNA被运往杨百翰大学(美国UT普洛佛)质量检查与pulse-field毛细管电泳其次是CLR图书馆建设和测序(PacBio续集II)。独特的分子收益率38 g和123 g,最长subread将军35 kb和28 kb,分别。PacBio读取被组装成使用Canu v2.0重叠群gydF4y2Ba128年gydF4y2Ba、配置组装两个单分别在每一个轨迹。两轮抛光被应用到每个装配调整原始PacBio数据使用pbmm2 (v1.3.0)和使用高分子共识设置箭头算法实现gcpp (v.1.9.0)gydF4y2Ba129年gydF4y2Ba。PacBio总成转位因子注释,除了马里兰引用,被EDTA v1.9.6生成gydF4y2Ba130年gydF4y2Ba使用组合fasta文件包含所有三个组件。gydF4y2Ba

缅因州和北卡罗来纳州海葵,短DNA片段被移除使用短读器套件(Circulomics)。图书馆是准备使用结扎纳米孔测序序列工具包(LSK109)和测序一个奴才流细胞(R9.4.1;牛津纳米孔技术)。纳米孔长读basecalled使用古比鱼(v4.5.2),组装成叠连群使用Canu v2.1gydF4y2Ba128年gydF4y2Ba,gydF4y2BaNv1gydF4y2Ba叠连群抛光使用雷达信标v1.4.21gydF4y2Ba131年gydF4y2Ba。缅因州的示例中,只有一个gydF4y2BaNv1gydF4y2Ba单体型是组装。评估的基因间的间距gydF4y2BaNv1gydF4y2Ba复制原始读取基于BLASTn搜索是一致的在所有读取暗示了一个纯合子个体。相比之下,评价的北卡罗莱纳生读了读可以分为两个不同的组根据不同基因间的间距。这两组分别读取被组装。gydF4y2Ba

在这项研究中,我们只有我们的分析集中于相对应的重叠群gydF4y2BaNv1gydF4y2Ba集群。这些重叠群和各自的gydF4y2BaNv1gydF4y2Ba拷贝数和本地化被确定使用BLASTn搜索组件。假基因被确定为本gydF4y2BaNv1gydF4y2Ba副本和过早停止密码子和截断成熟肽序列。剩下的部分基因组的分析每个克隆线将报告在以后的出版。gydF4y2Ba

的表达gydF4y2BaNv1gydF4y2Ba个人收集来自佛罗里达与nCounter量化技术。这种方法是完全相同的方法量化的报道gydF4y2BaNv1gydF4y2Ba为gydF4y2Ban vectensisgydF4y2Ba从其他地理位置报道Sachova et al。gydF4y2Ba86年gydF4y2Ba。简单地说,个人适应在20°C 24 h在黑暗中在15‰人工海水(ASW)。人随后在黑暗中暴露在三种温度:20°C(控制),28°C,并为24小时36°C。动物被放入管和冷冻为每个条件,获得三个复制两个动物/复制。提取RNA被运往分析使用nCounter平台(美国NanoString技术;美国由MOgene)的表达gydF4y2BaNv1gydF4y2Ba使用相同的自定义探测器之前报道。gydF4y2Ba

报告总结gydF4y2Ba

进一步研究信息设计是可用的gydF4y2Ba自然投资组合报告总结gydF4y2Ba与这篇文章有关。gydF4y2Ba