摘要
功能多样化、更高的进化速度和强烈的正向选择有助于有限数量的免疫基因与许多病原体相互作用。蛋白质编码区的重复序列是短时间内功能多样化、适应性变异和进化新颖性的一个众所周知的来源。重复序列在转录调控功能多样化、蛋白激酶、细胞粘附、信号通路、形态发生、DNA修复、重组和RNA加工等生物化学功能中起着至关重要的作用。重复长度的变化可以改变相关蛋白质的相互作用、功效和整体蛋白质网络。重复序列具有内在的不稳定性质,可以潜在地快速进化并加速复杂表型性状和功能的获得。由于它们能够在短进化距离内产生快速、自适应的变化,重复被认为是“调谐旋钮”。重复特定基因的长度变异,比如RUNX2而且ALX4,与脊椎动物的形态和生理变化有关。在这里,我们研究了重复长度的变化作为物种特异性免疫多样化的一个强有力的来源。此外,我们还提供了一份具有重复类型的免疫基因进化支的全面列表,以供将来研究种组内的形态/进化变化。我们观察到显著的重复长度变化FASLG而且C1QC啮齿目动物和灵长类动物的对比物种群中。
这是订阅内容的预览,通过你所在的机构访问
访问选项
订阅期刊
获得1年的完整期刊访问权限
119.00美元
每期只要14.88美元
所有价格均为净价格。
增值税稍后将在结帐时添加。
税务计算将在结账时完成。
买条
在ReadCube上获得时间限制或全文访问。
32.00美元
所有价格均为净价格。
![](https://media.springernature.com/m312/springer-static/image/art%3A10.1038%2Fs41435-022-00186-4/MediaObjects/41435_2022_186_Fig1_HTML.png)
![](https://media.springernature.com/m312/springer-static/image/art%3A10.1038%2Fs41435-022-00186-4/MediaObjects/41435_2022_186_Fig2_HTML.png)
![](https://media.springernature.com/m312/springer-static/image/art%3A10.1038%2Fs41435-022-00186-4/MediaObjects/41435_2022_186_Fig3_HTML.png)
![](https://media.springernature.com/m312/springer-static/image/art%3A10.1038%2Fs41435-022-00186-4/MediaObjects/41435_2022_186_Fig4_HTML.png)
![](https://media.springernature.com/m312/springer-static/image/art%3A10.1038%2Fs41435-022-00186-4/MediaObjects/41435_2022_186_Fig5_HTML.png)
![](https://media.springernature.com/m312/springer-static/image/art%3A10.1038%2Fs41435-022-00186-4/MediaObjects/41435_2022_186_Fig6_HTML.png)
数据可用性
与本研究相关的所有数据均可在补充资料中获得,用于分析的数据和脚本以易于浏览的格式提供:https://github.com/ceglablokdeep/Immune_genes_repeats.数据副本已上传到Mendeley数据集https://doi.org/10.17632/8zxtjh8fjs.1.
参考文献
Shultz AJ萨克顿TB。免疫基因是鸟类和哺乳动物共同积极选择的热点。Elife。2019;8:e41815。
邓娜,蔡丽玲,郭文纳普,陈国强。病毒是哺乳动物蛋白质适应的主要驱动力。Elife。2016;5:e12469。
高秀玲,陈晓明,陈晓明,陈晓明,等。六种哺乳动物基因组的正选择模式。公共科学学报,2008;4:e1000144。
阿尔凯德M,爱德华兹SV。鸟类toll样受体多基因家族的分子进化。《生物学报》2011;28:1703-15。
卡彭蒂尔,k, Geballe AP.蛋白激酶R和大型DNA病毒之间军备竞赛的进化观点。中国病毒学杂志,2016;90:3280-3。
肖爱华,张志刚,顾志刚,张志刚,等。通过I型干扰素反应的多物种比较揭示了哺乳动物先天免疫系统的基本特性。科学通报,2017;15:e2004086。
Solbakken MH, Rise ML, Jakobsen KS, Jentoft S.中央免疫基因的连续丧失是gaddiformes交替免疫的特征。《中国生物科学》2016;8:3508-15。
Blumer M, Brown T, Freitas MB, Destro AL, Oliveira JA, Morales AE,等。普通吸血鬼的batilluminate分子适应血液喂养的基因损失。科学通报2022;8:eabm6494。
齐默MM, Kibe A, Rand U, Pekarek L, Ye L, Buck S,等。宿主抗病毒蛋白ZAP的短亚型可作为SARS-CoV-2程序性核糖体框架转移的抑制剂。Nat community . 2021; 12:1-15。
杨玲,傅军,周勇。环状rna及其在免疫调节中的作用。前沿免疫,2018;9:2977。
维尔布臣T,菲茨杰拉德KA。抗病毒免疫中的长链非编码rna。中国生物医学工程学报。2021;26(3):344 - 344。
Persi E, Wolf YI, Koonin EV。积极和强烈放松的纯化选择驱动蛋白质重复序列的进化。Nat Commun.2016; 7:13570。
Marcotte EM, Pellegrini M, Yeates TO, Eisenberg D.蛋白质重复普查。中华分子生物学杂志,1999;29(3):341 - 341。
Albà MM, Tompa P, Veitia RA。氨基酸重复和蛋白质的结构和进化。基因与蛋白质进化。巴塞尔,2007;3:119-30。
对蛋白质组成顺序的系统分析揭示了生物功能的新特征和宏观进化的普遍关联。科学通报。2013;9:e1003346。
马晓明,王晓明,王晓明。蛋白质重复序列的结构、功能与进化。中国生物医学工程杂志,2001;
Karlin S, brobrochieri L, Bergman A, Mrázek J, Gentles AJ。氨基酸在真核生物蛋白质组和疾病关联中运行。自然科学进展,2002;29(3):344 - 344。
佩莱格里尼M,马科特EM,叶芝TO。一种用于重复序列蛋白质全基因组分析的快速算法。蛋白质结构功能。1999;35:44 - 6。
卡士Y,国王DG。简单序列重复是进化中的有利突变子。《趋势》,2006;22:253-9。
King DG, Soller M, Kashi Y.进化调谐旋钮。奋进号。1997;21:36-40。
林奇VJ,瓦格纳GP。恢复转录因子变化在发育进化中的作用。进化(纽约). 2008;62:2131-54。
李志强,李志强。蛋白质中简单序列重复序列及其对网络进化的意义。基因。2005;345:113-8。
Myers KA, Rahi-Saund V, Davison MD, Young JA, Cheater AJ, Stern PL. 5T4癌胎滋养层糖蛋白cDNA的分离。与转移相关的抗原含有富含亮氨酸的重复序列。生物化学学报,1994;29(3):319 - 324。
李志强,李志强,李志强,等。果蝇18轮是形态发生所必需的,与托尔有惊人的相似之处。发展。1994;120:885 - 99。
Kobe B, Deisenhofer J.富含亮氨酸重复序列的蛋白质。中国生物医学工程杂志,1995;5:409-16。
亨特利M,戈尔丁GB。蛋白质中简单序列的进化。中华药理学杂志,2000;
Gemayel R, Vinces MD, Legendre M, Verstrepen KJ。可变串联重复序列加速编码和调控序列的进化。2010.https://doi.org/10.1146/annurev-genet-072610-155046.
Fondon JW, Garner HR。快速和持续的形态进化的分子起源。美国国家科学研究院。2004; 101:18058 - 63。
潘志平,沈松,曲娟,梅杰,李志强,等。产生粘蛋白功能的基因进化机制。8.科学通报,2022;https://doi.org/10.1126/SCIADV.ABM8757.
Björklund ÅK,艾克曼D, Elofsson A.蛋白质结构域重复序列扩增。公共科学图书馆,计算生物学,2006;2:0959-70。
牛顿啊,帕斯克AJ。RUNX2 QA重复序列的进化和扩展与脊椎动物复杂性的出现相对应。《社区生物学》2020;3:771。
Fondon JW, Garner HR。快速和持续的形态进化的分子起源。美国国家科学研究院。2004; 101:18058 - 63。
梅伟林,李志强,李志强,李志强。RUNX转录因子在人体发育中的调控作用。发展。2019;146:1-19。
杜茜,张丽娟,张丽娟,陈志伟,陈志伟。成骨细胞分化的转录激活因子Osf2/Cbfa1。细胞。1997;89:747-54。
Gaillard JL, Berche P, Frehel C, Gouln E, Cossart P.单核增生乳杆菌进入细胞是由内部蛋白介导的,这是一种重复蛋白,让人联想到革兰氏阳性球菌的表面抗原。细胞。1991;65:1127-41。
Kȩdzierski Ł, Montgomery J, Curtis J, Handman E.富亮氨酸重复序列在宿主-病原体相互作用中的作用。Arch immune Ther Exp (Warsz)。2004; 52:104-12。
Reeder JC, Brown GV。恶性疟原虫疟疾的抗原变异与免疫逃避。免疫细胞生物学杂志1996;74:546 - 546。
疟原虫和其他真核寄生虫蛋白抗原中重复结构域的功能。《今日寄生虫》,1991;7:99-105。
Cohn M.免疫系统:一种大规模杀伤性武器,是进化为在dna战争中扳平比分而发明的。免疫杂志2002;185:24-38。
Sieling PA, Modlin RL。toll样感受器:哺乳动物的“味觉感受器”,用来接收各种微生物入侵者。《微生物学》2002;5:70-5。
toll样受体与先天免疫。中华免疫杂志2001;1:135-45。
范宁汉,张志刚,张志刚,张志刚,等。运用2022年。核酸Res. 2022;50: D988-95。
Agarwala R, Barrett T, Beck J, Benson DA, Bollin C, Bolton E,等。国家生物技术信息中心的数据库资源。核酸研究,2016;44:D7。
Kumar S, Stecher G, Suleski M, Hedges SB.时间树:时间线、时间树和发散时间的资源。中国生物医学杂志,2017;34:12 12 - 9。
Jetz W, Thomas GH, Joy JB, Hartmann K, Mooers AO。全球鸟类在时空上的多样性。大自然。2012;491:444-8。
哈里森点。fLPS 2.0:生物序列中成分偏区的快速注释。PeerJ。2021; 9: e12363。
埃德加钢筋混凝土。MUSCLE:一种降低时间和空间复杂度的多序列比对方法。BMC生物信息学。2004;5:13 3。
瑞LJ。phytools:一个R包,用于系统发育比较生物学(和其他东西)。方法生态环境学报,2012;3:217-23。
R核心团队。R:用于统计计算的语言和环境。2021.https://www.r-project.org.
Smith MD, Wertheim JO, Weaver S, Murrell B, Scheffler K, Kosakovsky Pond SL.少即是多:用于有效检测情景多样化选择的自适应分支随机效应模型。中国生物医学杂志2015;32:1342-53。
Kosakovsky Pond SL, Frost SDW, Muse SV。HyPhy:使用系统发育的假设检验。生物信息学。2005;21:676 - 79。
杨志。PAML 4:最大似然系统发育分析。生物化学学报,2007;24:1586-91。
葛士祥,荣德,荣德,姚荣。ShinyGO:一种图形化的动植物基因集富集工具。生物信息学。2020;36:2628-9。
montgomery S, Cruz JA, Shrivastava S, Arndt D, Berjanskii M, Wishart DS。PROTEUS2:一个综合蛋白质结构预测和基于结构注释的web服务器。核酸研究,2008;36:W202-9。
Omasits U, Ahrens CH, Müller S, Wollscheid B. Protter:交互式蛋白质特征可视化和与实验蛋白质组学数据的集成。生物信息学。2014;30:884-6。
Jumper J, Evans R, Pritzel A, Green T, figfignov M, Ronneberger O,等。高度准确的蛋白质结构预测AlphaFold。大自然。2021;596:583-9。
Waterhouse A, Bertoni M, Bienert S, Studer G, Tauriello G, Gumienny R,等。瑞士模型:蛋白质结构和复合物的同源模型。核酸研究,2018;46:W296-303。
Goddard TD, Huang CC,孟EC, Pettersen EF, Couch GS, Morris JH,等。UCSF ChimeraX:迎接可视化和分析的现代挑战。蛋白质科学,2018;27:14-25。
昆兰AR,霍尔IM。BEDTools:用于比较基因组特征的一套灵活的实用程序。生物信息学。2010;26:841-2。
Deryusheva EI, Machulin AV, Galzitskaya OV。具有重复序列的蛋白质的结构、功能和进化特征。Mol biology, 2021; 55:683-704。
詹韦CA,接近渐近线?免疫学的进化与革命。中华免疫杂志,2013;
识别微生物和激活免疫反应。大自然。2007;449:819-26。
田明,上松,竹内。病原体识别与先天免疫。细胞。2006;124:783 - 801。
杨晓东,杨晓东,杨晓东,Nuñez G. NOD-LRR蛋白在宿主-微生物相互作用和炎症疾病中的作用。生物化学,2005;74:355-83。
杨晓明,李志强,李志强,等。细胞内模式识别受体在宿主细胞中的作用。大自然。2006;442:39-44。
王志刚,王志刚,王志刚,等。分子生物学研究进展。中华免疫杂志1992;10:359-83。
Cocquet J, De Baere E, Caburet S, Veitia RA。成分偏差和聚丙氨酸在人类中存在。遗传学。2003;165:1613-7。
Albà MM, Guigó R.啮齿动物和人类氨基酸重复序列的比较分析。基因组Res. 2004; 14:549-54。
米尔P,阿兰尼斯-洛巴托G,安德拉德-纳瓦罗MA。用进化、位置和顺序来描述氨基酸同源重复体。蛋白质结构功能生物信息,2017;85:709-19。
杨晓燕,薛斌。蛋白质序列重复序列越完美,结构越松散。Febs j . 2010; 277:2673-82。
亨特利MA,戈尔丁GB。简单的序列在蛋白质数据库中是罕见的。蛋白质结构功能基因。2002;48:134-40。
莱特PE,戴森HJ。本质非结构蛋白质:重新评估蛋白质结构-功能范式。中华分子生物学杂志,1999;29(3):329 - 329。
戴森HJ,莱特PE。本质上无结构的蛋白质及其功能。细胞生物学,2005;6:197-208。
内在非结构蛋白质的结构和功能之间的相互作用。FEBS Lett, 2005; 579:3346-54。
Dosztányi陈杰,陈俊杰,陈志强,陈志强,陈志强。中枢蛋白序列重复序列及其对网络进化的影响。蛋白质组学杂志,2006;5:2985-95。
本质上无结构的蛋白质通过重复扩张进化。BioEssays。2003; 25:847-55。
查瓦利S,查瓦利PL,查兰松G, de Groot NS, Gemayel R, Latysheva NS,等。真核生物蛋白质中氨基酸重复序列出现的限制和后果。分子生物学杂志,2017;24:765-77。
Jones AL, Hulett MD, Parish CR.富组氨酸糖蛋白:血浆中调节免疫、血管和凝血系统的一种新型适配蛋白。免疫细胞生物学杂志2005;83:106-18。
人富含组氨酸糖蛋白的氨基酸序列,来源于其cDNA的核苷酸序列。生物化学。1986;25:2212-20。
血清中富组氨酸糖蛋白与金属的相互作用。生物化学,1981;20:1054 - 61。
哈瓦什MBF, Sanz-Remón J, Grenier JC, Kohn J, Yotova V, Johnson Z,等。灵长类动物对细菌和病毒病原体的先天免疫反应揭示了强度和特异性之间的进化权衡。美国国家科学研究院。2021; 118:1-10。
汉考克JM,沃瑟EA, Santibáñez-Koref MF。在人类和小鼠中调节致病和其他编码CAG重复序列进化出现的选择作用。《生物学杂志》2001;18:1014-23。
Pelletier N, Champagne N, Stifani S,杨晓军。MOZ和MORF组蛋白乙酰转移酶与runt结构域转录因子Runx2相互作用。致癌基因。2002;21:2729-40。
Runx2对骨发育和维持的调控。《生物科学》2008;13:898。
Nagata S, Golstein P. Fas死亡因子。科学(80 -)。1995; 267:1449-56。
德系A,迪克西特VM。死亡受体:信号和调制。科学(80 -)。1998; 281:1305-8。
李勇,孙勇,蔡敏,张辉,高宁,黄辉,等。Fas配体基因(Faslg)在大鼠坐骨神经损伤后神经变性和再生中起重要作用。神经科学。2018;11:1-13。
孙M,李S, Karray S,列维-施特劳斯M,艾姆斯KT,芬克PJ。前沿:Fas配体尾部的两个不同motif调控Fas配体介导的共刺激。中华免疫杂志2007;179:5639-43。
Blott EJ, Bossi G, Clark R, Zvelebil M, Griffiths GM. Fas配体通过细胞质尾部富含脯氨酸的结构域靶向分泌溶酶体。细胞科学进展(英文版);2001;
McCord JP, Grove TZ。改造免疫系统的重复蛋白。生物聚合物,2020;111。https://doi.org/10.1002/bip.23348.
张敏,王峰,李松,王勇,白勇,徐旭。故事:基因组编辑的故事。中国生物工程学报,2014;14(2):344 - 344。
李志强,李志强,李志强,等。虹膜免疫系统基因信息库的研究进展。基因组学。2005;85:503-11。
Abeler-Dörner L, Laing AG, Lorenc A, Ushakov DS, Clare S, Speak AO,等。高通量表型揭示了免疫变异的广泛遗传和结构基础。《免疫杂志》2020;21:86-100。
刘志强,刘志强,刘志强,等。干扰素调控基因注释数据库的更新。核酸研究,2013;41:D1040-6。
确认
我们感谢人力资源发展部为LT和SS提供奖学金。
资金
对Har Gobind Khorana计算生物学集群进行了计算分析,该集群是由IISER Bhopal根据拨款# INST/BIO/2017/019和生物技术部IYBA 2018建立和维护的。BT/11/IYBA/2018/03)和科学与工程研究委员会ECRA(批准号:BT/11/IYBA/2018/03)ECR / 2017/001430)。
作者信息
作者及隶属关系
贡献
LT和SS与NV一起撰写手稿,LT和SS分析数据并生成结果。所有作者都审阅了手稿。
相应的作者
道德声明
相互竞争的利益
作者声明没有利益竞争。
额外的信息
出版商的注意施普林格自然对出版的地图和机构从属关系中的管辖权主张保持中立。
权利和权限
根据与作者或其他权利持有人签订的出版协议,《自然》杂志或其许可方对本文拥有独家权利;作者对这篇文章接受的手稿版本的自我存档仅受此类出版协议的条款和适用法律的约束。
关于本文
引用本文
Teekas, L., Sharma, S. & Vijay, N.谱系特异性蛋白重复扩增和收缩揭示了免疫基因的可塑区域。基因Immun(2022)。https://doi.org/10.1038/s41435-022-00186-4
收到了:
修改后的:
接受:
发表:
DOI:https://doi.org/10.1038/s41435-022-00186-4