摘要
植物基因组内基因的空间组织可以驱动专门代谢途径的进化。萜类化合物是植物中重要的特殊代谢产物,具有多种适应功能,能够与环境相互作用。在这里,我们报告的基因组组装扁桃体脓肿寻常的,属barbatus,Leonotis益母草.我们研究了一个二萜类生物合成基因簇(BGC)与Lamiaceae(薄荷)家族中的其他7个物种的起源和随后的进化。基于在Lamiaceae所有物种的BGCs中发现的核心基因,我们预测在早期Lamiaceae祖先中进化出了这个集群的简化版本。现存bgc的目前组成突出了其演变的动态性质。我们阐明了萜类主链的生成Callicarpa美国包括蒽醌和萜烯(+)-丁香烯在内的BGC酶对BGC细胞色素P450s具有氧化活性。我们的工作揭示了BGC组装的流体性质和基因组结构在代谢产物起源中的重要性。
简介
植物以其难以置信的特殊代谢物多样性而闻名,这些代谢物在与环境的相互作用中起作用。这些生物合成途径是动态的,促进了新化合物的持续进化。近年来发表的高质量植物基因组的数量不断增加,导致人们发现一些代谢途径被组织成生物合成基因簇(BGCs)。BGC是由两个或两个以上不同类别的非同源基因组成的一组,这些基因在物理上聚集在一起,转录上相连,功能上相关1,2,3.,4,5,6.迄今为止,已有超过30种植物bgc被功能验证7自从在玉米中发现了第一个BGC8.在植物中发现的BGCs主要参与特化代谢而不是中枢代谢9并出现在多种类型的化合物中,包括罂粟中的苄基异喹啉生物碱10,11葫芦科中的三萜葫芦素12,13禾科和其他谷类中的二萜莫内酯14,15,16,17,18.
bgc如何形成以及为什么形成仍然是一个讨论的话题,尽管出现了一些假设。在细菌和真菌中,BGCs是常见的,并在水平基因转移过程中帮助整个途径的转移19,20..虽然目前还没有植物BGCs水平基因转移的报道,但BGCs在生物合成途径的垂直遗传方面仍具有优势5,21.BGCs传递的遗传连锁促进共遗传,从而保护整个通路的完整性22,23,24.在一些途径中,如莫内酯生物合成,单个基因的丢失会导致有毒中间体的积聚23.bgc的另一个适应度好处是共同调节的可能性,例如通过单个转录因子或调节区域。这可以在组织或特定发育阶段的方式中提供能量上有利的代谢物生产控制5,16,21,25,26,27,28.调控也可能发生在染色质水平,DNA和组蛋白甲基化调节整个簇的转录25,29,30.,31.
由于植物BGCs的研究仍处于起步阶段,它们的起源和进化也没有得到很好的理解。到目前为止,证据支持植物BGCs可能是由基因或基因组复制和/或基因组重排引起的5.BGC的形成可能在基因组的高活性区域得到增强,例如最近的工作详细描述了燕麦燕麦酸BGC在一个亚端粒区域的组装32.基因簇的诞生可以从单个共定位基因对开始。后续附加类酶的共定位可通过染色体重塑或转位发生5,21,30.,33.集群的扩展也可以通过串联、局部或全基因组复制来继续4,6,33,34,35.参与特化代谢的酶的内在杂乱性使快速的新功能化成为可能,促进了BGCs在不同植物谱系中进化时的功能分化34,36,37,38.最近的研究表明,在比较不同植物科的BGCs时,核心基因的保护和新功能/途径的多样化6,39.
萜类化合物是一类特殊的代谢物,在研究的bgc中有很好的代表性。植物萜类化合物的多样性令人难以置信,包含超过65,000个结构40使它们成为已知的最大一类植物天然产物。植物依赖萜类化合物进行许多相互作用,包括病原体和食草动物防御,信号传递和传粉者吸引41,42,43.萜烯合成酶(TPSs)催化二磷酸类异戊二烯前体形成萜烯骨架,根据其系统发育关系可分为8个亚家族(a-h)41,44,45.双环标记型二萜通常由II类(TPS-c)和I类(TPS-e)二萜合酶(diTPS)的连续活性形成。II类ditps催化20碳类异戊二烯二磷酸的质子介导环化,通常是香叶基香叶酰二磷酸(GGPP),形成特征的十氢萘核心。一类diTPS然后裂解二磷酸,并可能进一步分化二萜主链。二萜主链通过氧化和随后的偶联被其他类酶功能化以增加生物活性。细胞色素P450 (CYPs),特别是在膨胀型CYP71家族中,经常氧化萜烯,并已发现与tps以成对或扩展的bgc共定位2,46.
萜类植物在薄荷科(Lamiaceae)中多样性特别丰富47,48.22种不同Lamiaceae物种的基因组组装(补充表1),揭示了至少两类萜类化合物的bgc:从猫薄荷中提取的单萜类荆芥内酯(荆芥sp)。49和丹参中的二萜类丹参酮(丹参)24,50,51.丹参酮因其强大的药理活性而被研究,因此许多生物合成途径已被阐明(补充图。1)24,50,51,52,53,54,55,56,57,58,59.丹丹酮的萜主链是苯胺二萜,是由一类(+)-copalyl二磷酸((+)-CPP)合酶和一类苯胺二萜合酶形成的labdane二萜。枞木类二萜烯可能是广泛的生物活性二萜类化合物的萜前体,这些生物活性二萜类化合物在Lamiaceae和其他植物中普遍存在60.许多萜类化合物的抗菌作用表明它们在植物防御中具有天然作用60,61,62,63,64.鼠尾草酸是另一种在几个Lamiaceae物种中发现的具有强大抗氧化和抗癌特性的枞烷二萜65.鼠尾草酸及其相关二萜化合物的生物合成已被阐明迷迭香,鼠尾草而且鼠尾草后(迷迭香和鼠尾草)66,67并涉及许多与丹参酮生物合成相关的同源CYPs(补充图)。1).
以前的研究美国miltiorrhiza基因组已经发现了两个bgc,它们共同包含编码丹参酮diTPSs的基因和两个参与丹参酮生物合成的CYP76AHs24,50,51.第三个位点包含一系列cyp71d,包括负责丹参酮d环杂环的酶的两个基因(CYP71D375和CYP71D373)。最近发表的其他Lamiaceae基因组揭示了其他四个物种的共联BGCs:大牡丹,丹参而且黄芩(分别为柚木、猩红鼠尾草和中国黄芩)24,58,68.此外,我们之前报告过在Callicarpa美国(美国美蓝莓),含有咪地雷烯diTPS基因的同源物以及编码多个CYP76AHs和cyp71d的同源物69.这5个种的差异表明该BGC可能在Lamiaceae中普遍存在。
在这项工作中,为了探索二甲烯BGC的流行和进化,我们调查了10个Lamiaceae基因组组装的代表性面板(图2)。1).我们关注与BGC的同步性c .美国,这是迄今为止发现的最大的一个,跨度约400 Kb,包括7个ditps和12个cyp。我们的共联分析显示,在所有研究的物种中,核心的丁二烯生物合成基因都是保守的,同时突出了五个亚科中BGC的谱系特异性多样化。系统发育分析支持每个酶类的共同祖先,并能够重建最小的祖先集群。我们发现BGC在c .美国已经进化出双功能,除了米替雷烯之外,还提供了以前未识别的二萜(+)-丁香烯的支架。除了强调BGC双功能的实例外,这还为以前难以接近的双萜开辟了生物合成途径,这在植物中很少观察到10,70.我们还在另外四个物种中发现了复杂的蒽醌BGCs,为阐明之前未知的二萜类途径奠定了基础。比较植物家族中BGC的进化轨迹说明了基因组组织如何作为扩大代谢多样性的基础。
结果
的基因组组装和注释l .益母草,p . barbatus,p .寻常的
为了增加Lamiaceae家族代表的多样性,我们对另外三个基因组进行了测序,Leonotis益母草,属barbatus,扁桃体脓肿寻常的,使用10× Genomics的linked read方法。分离高分子量DNA,构建10× Genomics文库,利用Supernova进行基因组组装,生成假单倍型组装;伪单倍型-1被选择用于下游分析,结果为585 Mb (l .益母草), 1.25 Gb (p . barbatus),及820兆(p .寻常的)组件(表1).为p . barbatus而且p .寻常的,组装的基因组大小与流式细胞仪估计的基因组大小(分别为1.53 Gb和786 Mb)以及基于k-mer的超新星估计的基因组大小(分别为1.29 Gb和871 Mb)一致(补充表2).然而,对于l .益母草,流式细胞术(1042 Mb)、k-mers (688 Mb)和基因组组装(585 Mb)对基因组大小的估计存在差异。再加上杂合SNPs之间的距离较大l .益母草从超新星(16.9 Kb)输出,它很可能是l .益母草是一个同源四倍体,超新星组合是所有同源染色体的代表。
基准通用单副本正交仪(BUSCO)71假单倍型-1组装的结果显示,三个基因组中有>97%完整的BUSCOs(表2)2)中出现了18.5%和13.4%的重复BUSCOsl .益母草而且p . barbatus,表明在pseudohaplotype-1中存在保留的haplotigs。用lamiaceae训练的AUGUSTUS标记蛋白编码基因72矩阵结果为148,846 (l .益母草)、413,222 (p . barbatus),以及229,613 (p .寻常的)基因(补充表3.).用BUSCO和预测的蛋白质组评估注释的完整性,结果显示94.4% (l .益母草)、92.2% (p . barbatus)及91.2% (p .寻常的)完整的BUSCO正交序列,表明该注释提供了一个健壮的基因集。总数为57.9% (l .益母草), 74.4% (p . barbatus)及68.3% (p .寻常的)的基因组是重复的逆转录元件,而不是DNA转座子主导的基因组空间(补充表4).
Syntenic分析揭示了蒽醌生物合成基因簇的普遍性
c .美国提供了一个独特的机会来研究家族范围内的二萜BGC的进化,因为它与Lamiaceae的其他成员是姐妹谱系,并且具有大而密集的BGC。我们分析了9个Lamiaceae的基因组与我们的锚定物种,c .美国,测定其同位性。我们根据它们的组装质量和邻近性以及亚科表示(即系统发育位置)选择我们的基因组面板。我们选择了三个先前报道过的具有同步BGCs和可用基因组的物种(美国miltiorrhiza24,51, T.格兰迪斯68,美国baicalensis73),我们在这次研究中收集的三个物种(L.益母草,P. barbatus,p .寻常的),以及三个已发表基因组的物种(Hyssopus officinalis74黄貂草75,广藿香76).总的来说,这10个物种代表了目前公认的12个亚科中的5个,它们最近的共同祖先估计在6000万至7000万年前(图2)。1)77,78,79.作为一个接近Lamiales的外群,我们也进行了分析Erythranthe lutea(猴子花;以前Mimulus危害)80.
在抽取的10个Lamiaceae物种中,均含有与已知(+)-CPP和蒽合酶同源的diTPS基因。在7个物种中,这些ditps位于共向BGCs内(图2)。2).基因组P. vulgaris, P. barbatus,r . officinalis太分散了,无法确定它们是否属于一个更大的集群。据我们所知,本分析中的4个bgc之前没有报道过,这表明这个群集比最初描述的更加保守。所有bgc,除了在美国baicalensis含有多个CYP76AH基因。5种,c .美国,大牡丹,丹参,马胆草,l .益母草也至少有一个cyp71基因副本。
BGCs的比较提供了在不同谱系中这种簇的形成和维持的见解(图。2).的美国baicalensisBGC唯一不包含CYPs,但似乎有一个II类diTPS和一个额外的非同位的I类diTPS的串联重复。大多数BGCs中都存在非共时的diTPS和CYP基因,这表明在每个物种中都是动态组装和独立提炼的。还有一些diTPS和CYP假基因。有趣的是,这些BGCs中很少有中断基因。的h . officinalis而且c .美国BGCs包含较大的基因组区域,具有更多的基因间空间,而其他的如p .广藿香而且l .益母草结构紧凑,基因密集。我们推测两个星团的存在l .益母草是由于它的四倍体,并不是一个真正的复制。同样,octoploidp .广藿香显示了一些BGC副本的证据(补充图。2).很明显,每个BGC在保持核心咪地雷烯基因的同时,经历了一些谱系特异性的独立进化。
Lamiaceae中一个先祖的芍药簇的系统发育证据
为了更好地理解每个BGC的基因进化,我们估计了BGC中每个酶亚家族的系统发育关系以及一组来自Lamiaceae的功能特征内参基因,但CYP71D分支中很少有Lamiaceae的特征序列可用(图7)。3.).与其他被子植物lab丹型ditps一致,II类功能的ditps聚集在TPS-c亚家族,I类功能的ditps聚集在TPS-e亚家族。
正如预期的那样,两个亚科的同步性ditps具有共同的祖先。最近在TPS-c家族的串联复制是明显的c .美国而且美国baicalensis并有助于谱系特异性BGC扩张(图2)。3.而且4).系统发育还强调了一些非共位ditps的更遥远的起源。I类和II类序列的存在表明,独立获得是物种形成过程中多样化的一部分。密切检查与特征ditps的系统发育关系可以为可能的功能提供线索。所有II类ditps同向CamTPS6系统发育聚在分支TPS-c.2.2中,该分支包含所有已知的Lamiaceae (+)-CPP合成酶,以及一些产生(+)-构型的labdanes的diTPS酶。两种不同的II类酶序列Sb.71和Pc.28聚集在TPS-c中。生成化合物ent-而不是(+)-构型,所以这两种酶很可能是相同的。
BGCs中编码的I类酶均不聚集在枝TPS-e中。1、符合其在特化代谢中的预期作用。TPS-e。1clade primarily contains enzymes that convertent-CPP转化为赤霉素中间体ent-kaurene。所有BGC I类ditps都在TPS-e中集群。2,which mostly encodes enzymes that accept (+)-CPP as a substrate. The presence of a presumed (+)-CPP synthase encoded in every BGC supports the likelihood that these class I diTPSs can all utilize (+)-CPP. Genes syntenic withCamTPS9被分组在分支TPS-e.2.1,它包含了所有的Lamiaceae序列,除了一个编码已知催化生成咪地雷烯的酶。值得注意的是,每个BGC包含至少一个这些假定的蒽合酶序列。TPS-e.2.1演化支的另一个特征是内部γ畴的缺失,这在大多数ditps中保留,但在单和倍半tps中丢失。这三种非共工酶序列分为支TPS-e.2.2和TPS-e.2.3,它们只包含一些具有独特功能的特征序列。这些分支的功能异质性使得很难对这些BGC编码酶的可能功能得出结论,但确实为发现新的萜烯主干提供了有趣的可能性。
然而,系统发育分类并不是TPS功能的完美预测指标37,81之前的工作已经证明了高水平的分支特异性一致性,这使我们能够对BGC ditps的功能得出初步结论48.系统发育的证据支持这些BGCs可能至少有一个(+)-CPP合成酶和一个苯胺苷合成酶,使每株植物都能产生苯胺苷(图2)。3.).此外,一些bgc含有来自枝的ditps,可能提供独特的化学物质。
76AH酶亚家族中的CYPs在所分析的物种中表现出密切的系统发育聚类。已经发现几个功能特征的CYP76AHs在丹参酮和鼠尾草酸生物合成的关键步骤中氧化蒽醌54,55.虽然我们没能在r . officinalis由于RoCYP76AH酶是一种碎片化的组合,因此它们与其他bgc酶之间的密切关系支持了共同的祖先。几乎所有BGCs中的CYP76AHs在每个簇中都有平行序列,突出了串联复制在扩展该亚家族中的作用46,82.然而,有几个BGC CYP76AHs与syntelogs高度不同。的c .美国CYP76AH65、CYP76AH66和CYP76AH67酶在系统发育上是不同的,与其他BGC CYP76AHs的序列相似性仅为50-60%。这些酶与CYP76AKs的分支更相关,在本BGC中尚未发现,但它们是丹参酮和鼠尾草酸氧化网络的一部分。
71D亚家族中的CYPs与BGCs中的其他CYPs相似地表现出系统发育聚类。三个CYP71D序列h . officinalis而且l .益母草与CYP71D基因阵列在同一进化支美国miltiorrhiza这与丹参酮中呋喃环的形成有关24.SmCYP71D410是BGC Sm-b的成员,与HoCYP71D724和PbCYP71D381酶在系统发育上聚在一起。PbCYP71D381可氧化forskolin前体(13R)氧化manoyl,一种与蒽醌结构相近的化合物83.一种酶t .茅与其他BGC cyp71d相比,其相关性要低得多,与其他BGC cyp71d的序列相似度只有40-50%。这种酶可能是最近获得的另一种独立酶,尽管它是在cyp71亚家族中观察到的唯一一种酶。所有含有CYP71D基因的bgc也至少有一个重复,再次强调了重复在这些途径多样化中的重要性84.
所有四个亚家族中大多数酶的紧密系统发育聚类为共同的祖先起源和随后的谱系特异性重复提供了令人信服的证据。我们分析了syntelogs的存在/不存在,并提出了一个使用祖先状态重建的最小聚类模型。4;补充无花果。3.,4).syntelogs之间高度的序列保守支持了一个最小的祖先集群,其中包含编码一个(+)-CPP合成酶、一个咪地雷烯合成酶、一个CYP76AH和一个CYP71D的基因。这种BGC的动态性质在数百万年的进化中是明显的,通过基因损失,假基因的存在,以及在这些现存的Lamiaceae中观察到的非共线基因的添加。尽管存在这些差异,但祖先群落的高度保护是值得注意的。
由于几乎所有的Lamiaceae植物样本中都有蒽醌BGC的存在,我们还研究了该植物的同构性大肠lutea,一个密切相关的拉米亚莱斯外群77,80,85.我们发现了一个区域与c .美国含有II类和I类ditps但不含CYPs的BGC(补充图5).编码II类酶的基因El.26g64.91而且El.26g64.92,在分支TPS-c。2,showing some similarity with other (+)-CPP synthases (Fig.3.).我排序的类,El.26g64.77,在TPS-e.2.1范围内,但与演化支的其他部分不同,令人惊讶的是,它保留了γ畴。这种结构域的丢失在植物tps的进化过程中发生过多次86,所以可以想象,I类酶在大肠lutea代表由Lamiales中最近的共同祖先所共有的三结构域的miltiradiene合成酶。而大肠lutea部分聚类可能提供了一窥Lamiaceae BGC的祖先状态,对其他Lamiales基因组进行更广泛的检查将是未来工作的一个有趣途径,可以更坚定地建立该聚类中基因获取和丢失的时间表。
的功能特征c .美国BGC揭示了两个代谢模块和一个萜类主链
虽然越来越多的计算预测的bgc已经在植物中被鉴定出来,但只有少数具有功能特征。到目前为止,共调节已被证明是bgc中功能关系的一个更大的预测指标,而不是单独的共定位87.中两种bgc的前期分析美国miltiorrhiza, Sm-a和Sm-b,发现它们在根和气生组织中都有不同的表达。来自Sm-a和CYP76AHSm-b中的s仅在根组织中表达,并被发现是根丹参酮生物合成途径中的重要步骤50.此外,一系列根特异性CYP71D编码的酶也是丹参酮生物合成的组成部分,但位于基因组的其他位置24.另一个例子是,尽管共定位,但差异表达的ditps和CYPs在不同的特化代谢物途径中被报道是在植物cassanes/ ryzalides中发现的双功能基因簇栽培稻(大米)70而诺scapine/morphinan的生物合成罂粟花ssp.(罂粟花)11,57.表达的差异可能是植物利用基因组组织的一些好处,同时创造基于调控的独特途径的一种方式。
考虑到BGC的空前规模和复杂性c .美国,我们试图研究它是否是代谢统一的BGC。我们首先分析了8种组织类型的RNA表达,以确定BGC的表达模式(图2)。5;补充图。6)69.这揭示了BGC的前半部分和后半部分之间的明显分歧。前半部分优先在果实和根组织中表达,并含有(+)-CPP合酶(CamTPS6)69,预测的蒽合酶(CamTPS9),以及若干CYP76AHs。后半部分在花和幼叶组织中表达更强,包含非同源I类diTPS (CamTPS10),另一种预测(+)-CPP合成酶(CamTPS7),以及两个cyp71d基因,以及CYP76AH基因的部分片段(Ca.26-27).每个模块中diTPS II类/ I类对以及CYPs的存在表明该BGC可能进化出了不同的二萜类途径。此外,我们用已发表的转录组数据研究了其他物种中每种BGC的表达,但没有发现总体的表达趋势,与in不同c .美国(补充图。6).
我们研究了下列成员的酶活性c .美国集群:CamTPS7、CamTPS8、CamTPS9、CamTPS10、CamCYP76AH64、CamCYP76AH65、CamCYP76AH67、CamCYP76AH68、CamCYP76AH69、CamCYP71D716,CamCYP71D717.所有基因的组合瞬时表达烟草benthamiana评价酶的功能。通过GC-MS与已发表的DiTPS活性的质谱和保留时间进行比较,或使用NMR对先前未发表的活性进行比较,确定DiTPS功能(图2)。6).CamTPS7被证实是一种(+)-CPP合成酶(Supplementary Fig。7).CamTPS9是一种毫雷烯(1)合酶,与一些枞烯(2;ent-阿比塔-8,11,13-三烯)的自发芳构化反应在植物界与之前的观察一致88.CamTPS10与(+)-CPP合成酶配对,形成(+)-kaurene (4)(补充图。8- - - - - -10).这种活性的生物学相关性是由二萜类calliterpenone的结构支持的,它来自(+)-kaurene骨架,并已在多个文献中被记录Callicarpa物种89.木萜酮作为植物生长促进剂的潜力已被研究90,因此代表了一个有趣的生物合成靶点。这种(+)-丁香烯合酶的发现将使生物合成获得这组代谢物以及可能具有有用生物活性的非天然二萜类化合物91.的物理分组和相似的表达模式CamTPS10而且CamTPS7通过(+)-CPP合酶的复制、额外I类diTPS的招募和组织特异性基因表达的转移,支持该聚类已分化为两个代谢不同的模块。
建立路线后才能形成c .美国我们测试了每个CYP与该植物中发现的所有可能的二萜中间体(图2)。7):ent -kaurene (CamTPS12;补充图。11)和科拉维诺69由团簇外的ditps和BGC中的(+)-kaurene和miltiradiene形成。科拉维诺或ent-kaurene。CamCYP76AH67与蒽醌形成6种不同的氧化产物(1模拟,2- - - - - -b,无花果。7一个).根据分子离子的m/z值以及质谱与NIST数据库的比较,有两种匹配的氧化方式是松香烯的氧化方式,另外四种匹配的氧化方式是苯胺二烯的氧化方式。12).这些产物大多难以用柱层析分离,阻碍了完全的结构阐明。然而,我们能够净化2,核磁共振实验支持为15-羟基-ent-阿比塔-8,11,13-三烯(补充图。13- - - - - -15).在此位置上对枞烷二萜的氧化,以前只报道过两次:由2-氧戊二酸脱氢酶在美国miltiorrhiza92并通过CYP81AM1雷公藤93.CamCYP76AH68也显示出与米替雷烯的活性,极大地改变了产品结构,向枞烯方向转变,并提供少量氧化的枞烯(2摄氏度;补充图。12).这表明CamCYP76AH68可能使蒽醌的c环羟基化,与蒽醌自发芳构化相比,蒽醌的c环更易失水形成二甲二烯(图2)。8).在先前对丹参酮和鼠尾草酸生物合成相关酶的研究中,铁二醇合成酶表现出对枞林的偏好,但未观察到蒽醌酶促转化为枞林的现象。认为芳构化是自发的,可能是由阳光驱动的88.CamCYP76AH68的发现表明,至少在c .美国一种酶可以帮助米替雷烯转化为枞林。当我们用CamTPS6而且CamTPS10为了评估CYP与(+)-kaurene骨架的活性,我们观察到一个表达的峰值CamCYP71D717.然而,经过进一步的研究,我们意识到这种酶明显催化(+)-甘露的形成(6) from (+)-copalol (5), (+)-CPP的脱磷酸化产物(图;7 b和补充图。16).每个产生可观察产物的CYP/TPS酶组合然后与所有其他CYP组合表达。CamCYP76AH67结合CamCYP76AH68而蒽醌产生了至少一种氧化化合物(二维,无花果。7一个;补充图。12).结合CamTPS6与CamCYP71D716而且CamCYP71D717导致(+)-manool (6)至3(年代)羟基- (+)-manool (7),经NMR证实(图。7 b,8 b;补充无花果。17- - - - - -19).
据我们所知,在此研究中未见枞类二萜类化合物的报道c .美国,主要研究的是叶片中产生的氯烷二萜94,95,96.然而,其他Callicarpa物种,包括c . bodinieri而且c . macrophylla97,产生各种药用相关的枞烷二萜(图。8 c),表明至少在该属的一些植物中,枞烷骨架是一个关键的中间体64,97.我们分析了整个根提取物c .美国经GC-MS分析,发现与枞林及其氧化产物(2摄氏度)由CYP76AH68产生。这支持酶活性的生物学相关性在阐明n benthamiana(补充图。20.).
c .美国包含超过600个预测的CYPs,并且BGC CYPs很可能是基因组中其他地方的外周修饰酶的更大代谢网络的一部分69.然而,我们在这里报告的功能活动验证了BGC及其发散模块的生物学意义。CYPs表现出对(+)-copalol和miltiradiene主干的明显偏好,而不是植物中存在的其他二萜。在这两个模块中,(+)-丁香烯合酶和(+)-丁香烯合酶及其各自的(+)-CPP合酶表达差异显著。CYP76AHs对咪地雷烯更活跃,而CYP71Ds利用(+)-copalol。(+)-kaurene的功能化可能需要非聚集酶催化的氧化反应。
讨论
在本研究中,我们发现先前仅在少数种中发现的苯胺二烯BGC存在于五个不同的Lamiaceae亚科中。保存下来的酶序列和聚类中的基因顺序为早期Lamiaceae祖先的聚类提供了有力证据。从这个核心簇中,这些物种保留了形成标志性的蒽醌骨架所必需的ditps,但通过基因复制、序列分歧、基因获取和基因丢失来调整其化学多样性。我们可以推测,随着Lamiaceae家族的分化和种群对新环境的适应,祖先群落的代谢产物已经多样化。基因复制似乎是植物中TPSs和CYPs巨大多样性的进化和扩展的主要驱动因素2,41,86,98,以Lamiaceae的miltiradiene为例。这是值得注意的c .美国其中串联复制产生了5个顺序的、高度相似的CYP76AH基因。然而,每一个被研究的物种都至少有一个明显的复制事件,为代谢多样化的进化提供了物质。还有一个显著的集群扩张的例子,通过明显的招募CamTPS10在c .美国.(+)-kaurene合成酶的发现展示了具有不同转录模式的双功能BGC的另一个例子。在其他发现的多放射性BGCs中存在系统发育上不同的ditps,同样表明了多功能性。
从最近发现的形成和氧化同一主干的成对的ditps和CYPs的同源物可以看出,在Lamiaceae和其他种类的植物中,烯丙二烯骨架的保存表明,在Lamiaceae和其他种类的植物中,烯丙二烯骨架的保留有很强的选择压力t . wilfordii在遥远的Celastraceae中99.令人惊讶的是,人们对植物如何利用枞烷二萜知之甚少,但由于其抗菌活性,它们大多被认为与病原体反应有关60,One hundred..然而,人们广泛研究了枞醇对人体健康的重要性。它们具有抗肿瘤、抗菌、抗炎等一系列生物活性60,61,62,63,101.迄今为止,在Lamiaceae种中已报道了近500种枞烷二萜40,102.早期对Lamiaceae中这些二萜类化合物的研究采用了代谢物引导的方法,在丹参酮、鼠尾草酸和相关化合物的生物合成方面取得了很大进展。本研究的发现为在基因组学指导下研究整个Lamiaceae的附加枞烷二萜建立了一个框架。部分功能的刻画c .美国BGC和根代谢物数据支持在这种植物中存在一个苯胺二萜网络,尽管之前没有关于枞类的文献记载。进一步鉴定的其他已鉴定的米替雷烯bgcofficinalis, P. cablin,l .益母草同样可能导致未知化学物质的发现。
更深入地了解BGC基因所包含的酶活性也将有助于阐明BGC如何驱动代谢多样性的扩展。从现存的至少5个Lamiaceae亚科中苯胺二烯BGC的保存情况可以看出,基因共定位是植物特化代谢的重要因素。基因组组织在合成生物学中也具有特殊的意义,因为理解天然BGCs可以为异源系统中合成簇的构建和控制提供蓝图103.这项研究提出了一个目前有限的例子,BGC存在于整个家庭。随着植物基因组质量和数量的不断提高,未来大规模的BGC研究可能会发现,植物经常依赖BGC作为通过代谢多样性进行适应性的工具箱。
方法
共线性分析
BLAST函数makeblastdb (E- 1e的值−10, 5个对齐)104是用来创建蛋白质数据库的吗c .美国并对其他物种进行了检查。肽序列和基因组注释文件通过各自的数据库获得。之间的共程分析c .美国所有其他讨论的物种都使用标准的MCScanX管道进行(匹配得分= 50;匹配大小= 5;间隙惩罚=−1;重叠窗口= 5;E-value = 1e−5;最大间隙= 25)105.结果使用SynVisio进行可视化106.通过BLASTp对齐函数(Threshold = 0.05, Word Size = 3, Matrix = BLOSUM62, Gap Costs =存在:11扩展:1)确定70%序列身份截断,手动筛选正交线和共线。
祖传国家重建
现有的特征状态被收集到一个单一的文件中,编码为1表示每个基因存在,0表示每个基因不存在。使用phytools R包(版本0.7-80)执行祖先状态分析107.进化模型是使用来自' fitMK() '函数的信息选择的。祖先状态由' ace() '函数确定。
系统发育树
所有蛋白质系统发育中使用的序列都是从各自物种的注释肽序列中获得的。所使用的参考序列列表可以在图的源数据中找到。2.CYP注释由David Nelson(田纳西大学)提供。使用了全长蛋白编码序列,但从比对中删除了ditps中存在的质体靶向序列。使用ClustalOmega(版本1.2.4;默认参数)108系统发育树用RAxML (version 8.2.12;模型= protgammaauto;算法= a)109支持1000个引导复制。所有的对齐都可在我们的树精库(https://doi.org/10.5061/dryad.w9ghx3frg).的tree graphic was rendered using the Interactive Tree of Life (version 6.5.2)110.
三种Lamiaceae植物的基因组测序、组装和注释
从植物成熟叶片中分离到高分子量DNAL.益母草,P. barbatus,p .寻常的并使用Genome and Gel Bead Kit v2 (10× Genomics, Pleasanton, CA)构建了一个10× Genomics文库。文库在Illumina NovaSeq 6000 (Illumina, San Diego, CA)上以成对端模式测序,150 nt。文库由伊利诺伊大学香槟分校的Roy J. Carver生物技术中心制作并测序。基因组用10× Supernova (version 2.1.1)进行组装111.脚本“超新星运行”在默认设置下运行,除了- maxreads被设置为360000000 (p .寻常的)、531000000 (p . barbatus)或297550000 (l .益母草),在测试多个覆盖水平后,该方法在基因组邻近和估计基因组大小的百分比方面产生了最佳结果。为了获得fasta文件,' supernova mkoutput '使用' style=pseudohap2 '和' -headers =full '参数运行。使用AUGUSTUS (version 3.3)对非重复掩盖的假单倍型-1组合进行基因预测。72参数' -UTR = off ',以及' -species '和' c-extrinsicCfgFile '参数来使用来自密切相关物种的训练结果,h . officinalis(p . barbatus,p .寻常的)或t .茅(l .益母草).使用工具Assembly -stats(版本1.0.1)计算组装统计信息112.使用AUGUSTUS存储库(版本3.4.0)中的gtf2gff.pl将AUGUSTUS默认基因注释转换为GFF3格式,并且使用GAG(版本2.0.1)生成基因注释度量113.BUSCO(版本5.2.2)71使用谱系数据集' embryophyta_odb10在基因组模式下运行。为了识别三个从头组装的基因组中的重复序列,使用RepeatModeler(版本2.0.3)为每个组装创建了自定义重复库(CRL)。114.使用protexclusterer从每个CRL中删除蛋白质编码基因(版本1.2)115Viridiplantae repeats from RepBase (version 20150807)116来创建最终的CRL。使用RepeatMasker使用其对应的CRL重复屏蔽每个程序集(版本4.1.2-p1)117使用参数-e ncbi -s -nolow -no_is -gff。
转录组分析
图中使用的所有转录组数据集。5和补充图。6从SRA数据库下载。使用fastp修整原始读取(版本0.23.2)118,使用Salmon ' index '将其映射到相应的编码序列文件(版本1.8.0)119,并使用Salmon ' quant '进行量化(libtype=A,验证映射)。分析出每个集群的特定基因,以比较组织之间的表达水平。数据以log2(X + 1)的因子进行转换,其中量化表达X的值以无偏的方式加到所有基因上,以解释0表达的发生,并去除因低表达基因而导致的负对数值,这将夸大基因之间的差异。这种转化需要注意的是,低表达基因的表达似乎接近于0,而高表达基因则相对不受影响。基因是根据基因组中出现的顺序聚类的,而组织是根据组织组之间的相似性聚类的。使用ggplot2(3.1.1版本)生成热图120.
PCR和克隆
合成寡核苷酸见补充表5Figs的源数据中列出了本研究中所描述或讨论的所有酶的GenBank登录号和序列。2而且3..从根、果、叶和花的cDNA中pcr扩增候选酶,克隆编码序列并用相应的基因模型进行序列验证。然后将构建物克隆到植物表达载体peak - ht中121并用于瞬时表达测定n benthamiana.
中的瞬态表达式n benthamiana
瞬时表达测定n benthamiana是根据已公布的方案进行的吗48.具体地说,n benthamiana植物在受控生长室中,光照16h(24°C)和暗8h(17°C)循环下生长5周,然后入渗。共表达的构念分别转化为根癌土壤杆菌菌株LBA4404。培养物在含50µg/mL卡那霉素和50µg/mL利福平的LB中30°C培养过夜。离心收集培养物,用10ml水冲洗两次。细胞重悬,稀释至OD600在水中加入200µM乙酰丁香酮,在30°C下孵育1 - 2 h,每种酶的组合按1:1的比例混合不同的培养物,用1 mL注射器将4-5周龄的植物渗透到植物的下面(背面)n benthamiana叶子。所有的基因构建都与上游2- c -甲基- d -赤藓糖醇4-磷酸(MEP)通路中编码限速步骤的两个基因共同浸润: P. barbatus1-脱氧-d -木酮糖-5-磷酸合酶(PbDXS)和GGPP合酶(PbGGPPS)以促进二萜前体GGPP的生产91,122.将植株放回受控生长室(24°C, 12 H日循环)5天。用1ml己烷(diTPS产品)或乙酸乙酯(CYP产品)在18°C过夜,从渗透叶片中提取约200 mg新鲜重量。离心收集植物材料,去除有机相进行GC-MS分析。每个实验重复三次。所示数据来自具有代表性的单个重复实验。
根代谢物提取
在温室条件下生长的一株健康的3岁美洲植物的整个根系被收集起来,清洗,并与水混合以分解组织。然后将混合物与500 mL乙酸乙酯混合,并允许提取24 h。然后将有机层与水层分离,过滤,通过旋转蒸发器浓缩,并在−20°C保存。该提取物以1:500的乙酸乙酯稀释,用GC-MS分析。所有的GC- ms分析都在密歇根州立大学的质谱和代谢组学核心设施上进行,使用Agilent 7890 A GC, Agilent VF-5ms色谱柱(30 m × 250 m × 0.25 m,带有10 m的z - guard)和Agilent 5975 C检测器。入口设置为250°C无分离注入1 μ L和He载气(1 mL/min),在溶剂延迟3 min后激活检测器。所有测定和组织分析均采用以下方法:温度斜坡开始40°C,保持1 min, 40°C/min至200°C,保持4.5 min, 20°C/min至240°C, 10°C/min至280°C, 40°C/min至320°C,保持5 min。MS扫描范围设置为40-400。
产品放大和核磁共振
用于核磁共振分析,生产在n benthamiana系统放大到1l。采用真空渗透系统进行渗透农散装菌株。n benthamiana叶子。在600毫升己烷中,在4°C和150 rpm的条件下,提取约80克叶片组织。萃取物在旋转蒸发器上干燥。每种产品用硅胶闪柱层析纯化,流动相为100%己烷(+)-kaurene,从100%己烷到95/5己烷/乙酸乙酯连续柱洗3(年代)羟基- (+)-manool。核磁共振光谱在密歇根州立大学Max T. Rogers核磁共振设备上的布鲁克800 MHz或600 MHz光谱仪上测量,该光谱仪配备了使用CDCl的TCl冷冻探头3.作为溶剂。CDCl3.峰值为7.26 PPM和77.00 PPM1H和13C光谱。
报告总结
有关研究设计的进一步资料,请参阅自然组合报告摘要链接到这篇文章。
数据可用性
支持这项工作发现的数据可在论文和补充信息文件中获得。本研究中产生的原始基因组读数已根据以下登录代码保存在NCBI生物样本数据库中:属barbatus(SAMN26547115),Leonotis益母草(SAMN26547116),扁桃体脓肿寻常的(SAMN26547117).基因组组合已保存在NCBI中,并附有以下登录代码:属barbatus(JAPKLW000000000 [https://www.ncbi.nlm.nih.gov/nuccore/JAPKLW000000000.1/]),Leonotis益母草(JAPKLX000000000 [https://www.ncbi.nlm.nih.gov/nuccore/JAPKLX000000000.1/)),扁桃体脓肿寻常的(JAPKLY000000000 [https://www.ncbi.nlm.nih.gov/nuccore/JAPKLY000000000.1/])。本文描述的版本为XXXXXX010000000。中功能特征酶的序列Callicarpa美国可在NCBI GenBank数据库:ON260868 [https://www.ncbi.nlm.nih.gov/nuccore/ON260868.1/] -ON260876 [https://www.ncbi.nlm.nih.gov/nuccore/ON260876.1/].其他数据包括基因组组装和注释,GC-MS原始数据,NMR原始数据,系统发育比对,簇序列和共线性文件可以在我们的Dryad知识库中找到[https://doi.org/10.5061/dryad.w9ghx3frg].123源数据提供了这篇论文。
参考文献
Postnikova, O. A., Minakova, N. Y., Boutanaev, A. M. & Nemchinov, L. G.病原体反应基因在基因组中的聚类拟南芥.j .中国。植物医学杂志。53, 824-834(2011)。
布塔纳耶夫,a.m.等人。萜类在多种植物基因组中多样性的研究。国家科学院学报美国112, e81-e88(2015)。
Medema, m.h.等。关于生物合成基因簇的最少信息。Nat,化学。医学杂志。11, 625-631(2015)。
Nutzmann H.-W。,Huang, A. & Osbourn, A. Plant metabolic clusters—from genetics to genomics.叶绿醇。211, 771-789(2016)。
Nutzmann H.-W。,年代c一个zzocchio, C. & Osbourn, A. Metabolic gene clusters in eukaryotes.为基础。启麝猫。52, 159-183(2018)。
刘,Z.等。代谢多样化的驱动因素:动态基因组邻居如何在芸苔科产生新的生物合成途径。叶绿醇。227, 1109-1123(2020)。
Polturak, G. & Osbourn, A.生物合成基因簇在植物防御和植物相互作用中的新兴作用。公共科学图书馆Pathog。17, e1009698(2021)。
弗雷等人。草类化学植物防御机制分析。科学277, 696-699(1997)。
朱海勇,魏格尔,E. & Osbourn, A.从激素到次生代谢:植物代谢基因簇的出现。植物J。66, 66-79(2011)。
Winzer, T.等人。一个果实用于合成抗癌生物碱诺scapine的10基因簇。科学336, 1704-1708(2012)。
杨,等。三个染色体尺度的Papaver基因组揭示了morphinan和noscapine生物合成途径的间断拼凑进化。Commun Nat。12, 1-14(2021)。
尚,Y.等。黄瓜苦味的生物合成、调控与驯化。科学346, 1084-1088(2014)。
戴,L.等。参与罗汉果苷生物合成的葫芦二烯醇合酶和三萜糖基转移酶的功能表征。植物细胞物理。56, 1172-1182(2015)。
坂本,T.等。水稻赤霉素代谢酶基因及其相关突变体的研究进展。植物杂志。134, 1642-1653(2004)。
王鹏荣,徐敏,金玉玉,Coates, R. M., Peters, R. J. syn - pimara -7,15-二烯合酶的鉴定及其萜类合酶的功能聚类。植物杂志。135, 2098-2105(2004)。
施梅尔茨,E. A.等人。单子叶萜类植物抗毒素的合成、诱导及作用。植物J。79, 659-678(2014)。
Kitaoka, N.等。水稻乳内酯生产生物合成基因簇的相互依赖进化。植物细胞https://doi.org/10.1093/plcell/koaa023(2020)。
梁,J.等。水稻含有一种生物合成基因簇,与casbane - type二萜phytoalexin的产生有关ent10 oxodepressin。新植醇.https://doi.org/10.1111/nph.17406(2021)。
槽,J. C.和希贝特,D. S.真菌硝酸盐同化基因簇的水平转移和生态转变:系统发育研究。《公共科学图书馆•综合》2, e1097(2007)。
在真菌中,多个GAL通路基因簇通过不同的机制独立进化。国家科学院学报美国107, 10136-10141(2010)。
菲尔德,B.等。动态染色体区域内植物代谢基因簇的形成。国家科学院学报美国108, 16116-16121(2011)。
塔克斯,A. M. & Rook, F.为什么化学防御化合物的生物合成基因聚集。植物科学17, 383-388(2012)。
张俊杰,张丽娟,张丽娟。为什么莫内酯总是与植物生物合成基因簇相关?国家科学院学报美国117, 13867-13869(2020)。
Ma, Y.等人。CYP71D亚家族内的扩增驱动丹参酮合成的杂环化丹参.Commun Nat。12, 685(2021)。
李志强,李志强,Pál,李志强。真核生物基因序的进化动力学研究。Nat. Rev. Genet。5, 299-310(2004)。
齐,x等。燕麦次生代谢的基因簇:对植物代谢多样性进化的影响。国家科学院学报美国101, 8233-8238(2004)。
冈田,A.等。OsTGAP1是bZIP转录因子,协调调控水稻诱导产生二萜类植物抗毒素。生物。化学。284, 26510-26518(2009)。
马格福德,s.t.等人。植物代谢基因簇的模块化:在燕麦中三萜酰化共同需要的三个相连基因。植物细胞25, 1078-1092(2013)。
Yu, N.等。利用染色质特征描述植物基因组中的代谢基因簇。核酸测定。44, 2255-2265(2016)。
罗卡斯,A, Wisecaver, J. H. &林德,A. L.真菌代谢基因簇的诞生,进化和死亡。Nat. Rev.微生物。16, 731-744(2018)。
Nutzmann H.-W。et al。活性和抑制的生物合成基因簇具有空间上不同的染色体状态。国家科学院学报美国117, 13800-13809(2020)。
李,Y.等。谷物中抗微生物防御化合物多基因通路的亚端粒组装。Commun Nat。12, 2563(2021)。
刘,Z.等。植物中典型生物合成基因簇的形成与多样化。Commun Nat。11, 5354(2020)。
田晓明,杨晓明,杨晓明,等。不同植物中操纵子样基因簇的代谢多样化独立组装。科学320, 543-547(2008)。
Itkin, M.等人。茄科作物抗营养生物碱的合成是由聚类基因介导的。科学341, 175-179(2013)。
Matsuba, Y.等。萜类生物合成复杂位点的进化茄属植物.植物细胞25, 2022-2036(2013)。
约翰逊,S. R.等。杂化萜合酶扁桃体脓肿寻常的强调底物和室室切换在萜烯合酶进化中的重要性。叶绿醇。223, 323-335(2019)。
申克,C. A. & Last, R. L.位置,位置!细胞重新定位促进了特化代谢多样化。2月J。287, 1359-1368(2020)。
Fan, P.等。茄科植物基因簇的演化与代谢多样性的出现。eLife9, e56717(2020)。
天然产物词典30.2,CRC出版社,泰勒和弗朗西斯集团,Informa集团公司(访问8/2022)。https://dnp.chemnetbase.com/faces/chemical/ChemicalSearch.xhtml.
Chen, F., Tholl, D., Bohlmann, J. & Pichersky, E.植物中的萜烯合酶家族:一个中等大小的基因家族,用于特化代谢,在整个王国高度多样化。植物J。66, 212-229(2011)。
植物萜类化合物的生物合成及其生物学功能。学生物化学放置。Eng。Biotechnol。148, 63-106(2015)。
Gershenzon, J. & Dudareva, N.萜烯天然产物在自然界中的作用。Nat,化学。医学杂志。3., 408-414(2007)。
Bohlmann J., Steele, C. L. & Croteau, R.大冷杉(Abies grandis)单萜合酶:月桂烯合酶(-)-(4S)-柠檬烯合酶和(-)-(1S,5S)-蒎烯合酶cDNA的分离、鉴定及功能表达。生物。化学。272, 21784-21792(1997)。
Karunanithi, P. S. & Zerbe, P.萜类合酶在植物萜类化学多样性进化中的代谢看门人。前面。植物科学。10, 1166(2019)。
巴斯,U. & Tissier, a .细胞色素P450酶:植物二萜多样性的驱动力。植物化学161, 149-162(2019)。
植物分泌结构的演化与萜类化学多样性的出现。为基础。植物生物学.66, 139-59(2015)。
约翰逊,S. R.等。一种数据库驱动的方法识别了薄荷家族(Lamiaceae)中额外的二萜合酶活性。生物。化学。294, 1349-1362(2019)。
Sherden, N. H.等。环烯醚萜合酶的鉴定荆芥物种:环烯醚环化不决定荆芥内酯立体化学。植物化学145, 48-56(2018)。
徐,H.等。药用植物基因组序列分析丹参.摩尔。植物9, 949-952(2016)。
宋,Z.等。的高质量参考基因组序列丹参提供洞察丹参酮的合成在其红色根状茎。植物基因组13, e20041(2020)。
高,W.等。丹参酮生物合成的功能基因组学方法提供了立体化学见解。Org。列托人。11, 5170-5173(2009)。
Ma, Y.等人。涉及萜类生物合成的新基因的全基因组鉴定和表征丹参.J. Exp. Bot。63, 2809-2823(2012)。
郭,J.等。CYP76AH1催化丹参酮生物合成中蒽醌的转化,并使酵母中异源产生铁酚。国家科学院学报美国110, 12108-12113(2013)。
郭,J.等。细胞色素P450混杂导致丹参酮生物合成途径分叉。叶绿醇。210, 525-534(2016)。
崔,G.等。药用植物中二萜合成物的功能差异丹参.植物杂志。169, 1607-1618(2015)。
白,Z.等。乙烯反应因子SmERF6共同调节SmCPS1和SmKSL1的转录,并参与丹参酮的生物合成丹参多毛的根源。足底248, 243-255(2018)。
王,Z. & Peters, R. J.丹参酮:引领Lamiaceae labdan相关的二萜生物合成。咕咕叫。当今。植物医学杂志。66, 102189(2022)。
歌,j j。et al。一种依赖于2-羟戊二酸的双加氧酶将二氢呋喃转化为呋喃鼠尾草二萜。植物杂志。188, 1496-1506(2022)。
González, m.a.芳香枞烷二萜:生物活性和合成。奈特·普罗德代表32, 684-704(2015)。
史密斯,E. C. J.,韦勒姆,N., Zloh, M. & Gibbons, S. 2β-乙酰氧基铁基醇-一种从树皮中提取的新型抗菌枞烷二萜Prumnopitys andina.Phytochem。列托人。1, 49-53(2008)。
Machumi, F.等人。抗微生物和抗寄生虫的菊酯类化合物的根Clerodendrum eriophyllum.Nat. Prod. Commun。5, 1934578x1000500605(2010)。
Abdissa, N, Frese, M. & Sewald, N.抗菌枞类二萜属各.分子22, 1919(2017)。
高,J.等。抗nlrp3炎性小体枞烷二萜Callicarpa bodinieri并对其结构进行了说明。下巴。化学。列托人。31, 427-430(2020)。
birtiic, S., Dussort, P., Pierre, f - x。,Bily, A. C. & Roller, M. Carnosic acid.植物化学115, 9-19(2015)。
Ignea, C.等人。由合成生物学平台阐明鼠尾草酸的生物合成。国家科学院学报美国113, 3681-3686(2016)。
谢勒,等人。鼠尾草酸的生物合成及其在酵母中的重建。Commun Nat。7, 12942(2016)。
赵,D.等。染色体尺度的基因组组装Tectona茅揭示了串联基因复制的重要性,并使天然产物生物合成途径中的基因发现成为可能。Giga科学https://doi.org/10.1093/gigascience/giz005(2019)。
汉密尔顿,J. P.等。产生驱虫萜类的Lamiaceae物种的染色体尺度基因组组装,Callicarpa美国.GigaScience9, giaa093(2020)。
Swaminathan, S., Morrone, D., Wang, Q., Fulton, D. B. & Peters, R. J. CYP76M7是一种药物ent-卡萨二烯c11 α-羟化酶在水稻中定义了第二个多功能二萜生物合成基因簇。植物细胞21, 3315-3325(2009)。
Manni, M., Berkeley, m.r., Seppey, M., Simão, f.a. & Zdobnov, e.m. BUSCO更新:新颖和精简的工作流程以及更广泛和更深入的系统发育覆盖,用于真核生物、原核生物和病毒基因组的评分。摩尔。杂志。另一个星球。38, 4647-4654(2021)。
斯坦克等人。奥古斯都:从头预测替代转录本。核酸测定。34, w435-w439(2006)。
徐哲,等。比较基因组分析黄芩而且黄芩barbata揭示了活性类黄酮生物合成的演化过程。基因组学Proteom。Bioinforma。18, 230-240(2020)。
利希曼,B. R.等人。猫薄荷中猫引诱剂荆芥内酯的进化起源。科学。阿德.6, eaba0721(2020)。
Bornowski, N.等。四种烹饪草本植物的基因组测序揭示了Nepetoideae化学多样性的萜类基因。DNA Res。27, dsaa016(2020)。
他,Y.等人。药用植物八倍体基因组和转录组的构建广藿香从唇形目。科学。数据5, 180274(2018)。
Godden, g.t., Kinser, t.j., Soltis, P. S. & Soltis, D. E.植物转录组学分析揭示了薄荷古代多倍体的不对称基因复制动态和特征。基因组医学杂志。另一个星球。11, 3393-3408(2019)。
姚,G.等。植物的系统发育关系、性状进化和生物地理多样性减小s.l。(唇形科)。摩尔。Phylogenet。另一个星球。98, 184-200(2016)。
Li, P.等。薄荷族Elsholtzieae (Nepetoideae, Lamiaceae)分子系统发育和生物地理学研究,重点是其在东亚的多样化。科学。代表。7, 2057(2017)。
库利,a.m.等人。杂交中空间复杂颜色图案的遗传结构Mimulus.预印在https://doi.org/10.1101/2022.04.29.490035(2022)。
Durairaj, J.等人。植物倍半萜合酶的特征分析。植物化学158, 157-165(2019)。
巴克,S.等。细胞色素P450酶。阿拉伯人。我的书。Soc。植物医学杂志。9, e0144(2011)。
帕特拉基,等人。环AMP助推剂的生物合成锦紫苏forskohlii.eLife6, e23001(2017)。
基因复制和基因表达的自然变异在代谢进化中的作用。《公共科学图书馆•综合》3., e1838(2008)。
刘,B.等。的系统发育关系Cyrtandromoea而且Wightia重新审视:Phrymaceae的一个新部落和Lamiales的一个新家族。j .系统。另一个星球。58, 1-17(2020)。
希尔维格,M. L.等。在植物萜类合成酶的进化过程中,结构域丢失已独立发生过多次。植物J。68, 1051-1060(2011)。
Wisecaver, J. H.等。一种全球共表达网络方法,将基因连接到植物的专门代谢途径。植物细胞29, 944-959(2017)。
李志强,李志强,李志强,等。CYP76AH4的研究进展及对Lamiaceae中酚类二萜生物合成的影响。Org。Biomol。化学。11, 7650(2013)。
琼斯,W. P.和金霍恩,A. D.属的具有生物活性的天然产物。Callicarpa。咕咕叫。Bioact。化合物。4, 15-32(2008)。
Bose, S. K.等。赤霉素酸和木萜酮对植物生长特性、毛状体、精油生物合成及通路基因表达的差异影响各种薄荷l植物杂志。物化学。66, 150-158(2013)。
anderson - ranberg, J.等人。通过立体化学控制的组合生物合成扩展二萜结构多样性的景观。Angew。化学。Int。艾德,心血管病。55, 2142-2146(2016)。
胡,Z.等。中国枞醇型二萜生物合成途径中一个2OGD的功能表征丹参.前面。植物科学.13, 947674(2022)。
王,J.等。细胞色素P450 CYP81AM1雷公藤催化脱氢枞酸的C-15羟基化。足底254, 95(2021)。
Cantrell, C. L., Klun, J. A., Bryson, C. T., Kobaisy, M. & Duke, S. O.从美国(Callicarpa美国)和日语(Callicarpa粳稻紫珠。j·阿格利司。食品化学。53, 5948-5953(2005)。
琼斯,W. P.等。从果枝的细胞毒成分Callicarpa美国在佛罗里达南部采集。纳特。70, 372-377(2007)。
德特韦勒等人。克罗烷二萜Callicarpa美国耐甲氧西林金黄色葡萄球菌对β-内酰胺类抗生素再敏感。ACS感染。说。6, 1667-1673(2020)。
王,Z.-H。,Niu, C., Zhou, D.-J., Kong, J.-C. & Zhang, W.-K. Three new abietane-type diterpenoids fromCallicarpa macrophyllaVahl。分子22, 842(2017)。
江,S.-Y。,Jin, J., Sarojam, R. & Ramachandran, S. A comprehensive survey on the terpene synthase gene family provides new insight into its evolutionary patterns.基因组医学杂志。另一个星球。11, 2078-2098(2019)。
汉森,N. L.等。雷公藤细胞色素P450s催化雷公藤内酯生物合成中的甲基转移和环氧化。Commun Nat。135011(2022)。
查图维迪,R.等人。枞烷二萜是一种有效的全身获得性抗性激活剂。植物J。71, 161-172(2012)。
史密诺娃,i.e., Tret 'yakova, e.v., Baev, d.s. & Kazakova, o.b.合成改性的野烷二萜酸为有效的抗菌药物。Nat. Prod. Res。0, 1-9(2021)。
曾,T.等。TeroKit:一个数据库驱动的web服务器,用于萜类研究。j .化学。正无穷。模型。60, 2082-2090(2020)。
Nutzmann H.-W。植物特化代谢中的基因聚类。咕咕叫。当今。Biotechnol。26, 91-99(2014)。
卡马乔等。BLAST+:架构和应用程序。BMC Bioinform。10, 421(2009)。
王毅,等。MCScanX:用于检测和进化分析基因同步性和共线性的工具包。核酸测定。40, e49-e49(2012)。
Bandi, V. & Gutwin, C. SynVisio: MCScanX的交互式多尺度synteny可视化工具。在第46届图形接口会议论文集2020年图形接口论文集(GI ' 20)(加拿大人机通信学会,2020年)。
雷维尔,L. J. Phytools:系统发育比较生物学(和其他东西)的R包。生态方法。另一个星球。3., 217-223(2012)。
西弗斯,F.等人。使用Clustal Omega快速,可扩展生成高质量的蛋白质多序列比对。摩尔。系统。医学杂志。7, 539(2011)。
RAxML版本8:用于系统发育分析和大系统发育后分析的工具。生物信息学30., 1312-1313(2014)。
Letunic, I. & Bork, P.交互式生命树(iTOL) v5:系统发育树显示和注释的在线工具。核酸测定。49, w293-w296(2021)。
Weisenfeld, n.i, Kumar, V., Shah, P., Church, d.m. & Jaffe, d.b.二倍体基因组序列的直接测定。基因组Res。27, 757-767(2017)。
Assembly-stats。(2022)。https://github.com/thh32/Assembly-stats
Geib, s.m.等人。基因组注释生成器:一个简单的工具,用于生成和纠正WGS注释表,供NCBI提交。GigaScience7, giy018(2018)。
弗林,J. M.等人。RepeatModeler2用于自动发现转座因子家族的基因组。国家科学院学报美国117, 9451-9457(2020)。
坎贝尔,m.s.等人。MAKER-P:用于快速创建、管理和质量控制植物基因组注释的工具包。植物杂志。164, 513-524(2014)。
Jurka, J.等人。Repbase Update,一个真核生物重复元素数据库。Cytogenet。基因组Res。110, 462-467(2005)。
Chen, N.使用RepeatMasker识别基因组序列中的重复元素。咕咕叫。Protoc。Bioinform。5, 4.10.1-4.10.14(2004)。
陈淑娟,周勇,陈勇,顾杰。fastp:一种超快一体化FASTQ预处理器。生物信息学34, i884-i890(2018)。
Patro, R., Duggal, G., Love, M. I., Irizarry, R. A. & Kingsford, C. Salmon:使用双阶段推理对转录本表达进行快速和偏见感知量化。Nat方法。14, 417-419(2017)。
韦翰,H。ggplot2:数据分析的优雅图形(Springer-Verlag纽约,2016)。
塞恩斯伯里,F., Thuenemann, E. C. & Lomonossoff, G. P. pEAQ:在植物中简单快速瞬时表达异种蛋白的通用表达载体。生物科技植物》。J。7, 682-693(2009)。
英格伦,E, anderson - ranberg, J.,苗,R., Hamberger, B. &林德伯格,P.代谢工程集胞藻属sp. PCC 6803用于植物二萜氧化manoyl oxide的生产。ACS合成器。医学杂志。4, 1270-1278(2015)。
布莱森,A. E.等人。在Lamiaceae中发现了一个蒽醌生物合成基因簇,揭示了一个动态的进化轨迹。出版者:仙女,https://doi.org/10.5061/dryad.w9ghx3frg(2022)。
Boachon, B.等。系统基因组学研究揭示了薄荷叶科植物化学多样性进化的多种机制。摩尔。植物11, 1084-1096(2018)。
Guenard, D., Gueritte-Voegelein, F. & Potier, P. Taxol和taxotere:发现,化学和结构-活性关系。Acc。化学。Res。26, 160-167(1993)。
克罗托,R.,凯彻姆,R. E. B., Long, R. M., Kaspera, R. & Wildung, M. R.紫杉醇生物合成与分子遗传学。Phytochem。牧师。5, 75-97(2006)。
帕登,C. J.等。强效抗疟青蒿素的高水平半合成生产。自然496, 528-532(2013)。
帕特拉基,等人。氧化Manoyl oxide (13R), forskolin的生物合成前体,在特化的根软木细胞中合成锦紫苏forskohlii.植物杂志。164, 1222-1236(2014)。
确认
这项工作得到了密歇根州立大学网络研究所和佐治亚高级计算资源中心提供的部分计算资源和服务的支持。我们要感谢密歇根州立大学质谱和代谢组学核心设施的Cassandra Johnny博士在获取和解释GC-MS数据方面的帮助,以及Daniel Holmes博士和Max T. Rogers NMR设施在获取和解释NMR数据方面的帮助。我们还要感谢David Nelson博士为本工作中提出的所有CYP序列命名,Kevin Childs博士的建议和指导,Wajid Bhat博士为基因组测序提取DNA,以及Malik Sankofa在植物、培养基和一般实验室准备方面的帮助。这项工作得到了B.H.和C.R.B.的密歇根州立大学战略合作伙伴资助计划(“植物生物合成途径的进化驱动基因组挖掘”)的支持,并通过格鲁吉亚研究联盟资金支持C.R.B. B.H.感谢美国能源部五大湖生物能源研究中心合作协议DE-SC0018409,生物化学和分子生物学部门的启动资金,以及AgBioResearch (MICL02454)的支持。B.H.感谢James K. Billman, Jr.的慷慨捐赠,M.D. G.M.得到密歇根州立大学植物生物技术健康和可持续发展培训计划(T32-GM110523)的奖学金支持,E.L.得到NSF研究生研究奖学金计划(DGE-1848739)的支持,A.B.得到NSF影响培训赠款(DGE-1828149)的支持。B.H.部分得到了国家科学基金会的资助,资助号为1737898。本材料中表达的任何观点、发现、结论或建议都是作者的观点,并不一定反映美国国家科学基金会的观点。密歇根州立大学占据了Ojibwe、Odawa和Potawatomi人民的anishinaabg -三火联盟的祖先、传统和现代土地。该大学位于1819年萨吉诺条约割让的土地上。
作者信息
作者及隶属关系
贡献
A.E.B、E.R.L和B.H.构想并设计了这项研究;A.E.B.和E.R.L.进行实验;A.E.B.和D.M.进行了同步分析;khl组装并注释了基因组;B.V.和J.P.H.进行了基因组分析;a.e.y进行了祖先状态重建;E.R.L.和G.P.M.对实验数据进行了分析;A.E.B、E.R.L和P.P.E.生成并分析了系统发育关系;A.E.B、E.R.L和B.H.撰写了手稿;B.H.和C.R.B.负责监督该项目; all authors contributed to revisions.
相应的作者
道德声明
相互竞争的利益
作者声明没有利益竞争。
同行评审
同行评审信息
自然通讯感谢Marnix Medema、Kai Ye和其他匿名审稿人对这项工作的同行评审所做的贡献。同行评审报告是可用的。
额外的信息
出版商的注意施普林格自然对出版的地图和机构从属关系中的管辖权主张保持中立。
源数据
权利和权限
开放获取本文遵循知识共享署名4.0国际许可协议(Creative Commons Attribution 4.0 International License),允许以任何媒介或格式使用、分享、改编、分发和复制,只要您对原作者和来源给予适当的署名,提供知识共享许可协议的链接,并注明是否有更改。本文中的图像或其他第三方材料包含在文章的创作共用许可中,除非在材料的信用额度中另有说明。如果内容未包含在文章的创作共用许可协议中,并且您的预期使用不被法定法规所允许或超出了允许的使用范围,您将需要直接获得版权所有者的许可。要查看此许可证的副本,请访问http://creativecommons.org/licenses/by/4.0/.
关于本文
引用本文
布莱森,a.e.,拉尼尔,急诊室,刘,K.H.et al。在Lamiaceae中发现了一个蒽醌生物合成基因簇,揭示了一个动态的进化轨迹。Nat Commun14, 343(2023)。https://doi.org/10.1038/s41467-023-35845-1
收到了:
接受:
发表:
DOI:https://doi.org/10.1038/s41467-023-35845-1