对一些人来说,非编码rna是垃圾。随着时间的推移,他们已经离开了众所周知的垃圾场。来源:Lya_Cattel / Getty Images

垃圾。在一些人看来,这就是非编码rna (ncRNAs)——被转录但不被翻译成蛋白质的基因。昆士兰大学(University of Queensland)的研究人员蒂姆·默瑟(Tim Mercer)回忆起他的一篇ncRNA论文时,两个审稿人说:“这很好”,第三个说:“这都是垃圾;非编码rna没有功能。”在默瑟看来,关于ncrna的争论通常已经从“都是垃圾”转移到“哪些是功能性的?”和“他们在做什么?”研究人员正在规划该领域的未来,这是本次会议的主题第二个故事在本期节目中。ncRNA领域的科学家们一直面临着质疑,并努力消除这种质疑。这里有一些个人的历史。

1869年,弗里德里希·米歇尔分离出了“核蛋白”,并“提出了”它可能是遗传物质的想法,一本新书的作者写道,RNA:遗传信息的中心1由新南威尔士大学RNA生物学教授约翰·马蒂克和巴西São保罗Insper大学的保罗·阿马拉尔共同完成。核素后来被证明是DNA。此后不久,核糖核酸(RNA)被分离出来。但是,他们写道,核酸在1940年之前几乎没有出现在生物化学的历史上。蛋白质被认为具有比“假定的核酸的单调性”更大的化学多样性,后者被认为是“仅仅是结构或代谢实体”。

在20世纪80年代,Nicholas Delihas和他在石溪大学的实验室提供了第一个RNA基因和RNA转录体调节另一个基因表达的实验证据。来源:石溪大学

20世纪60年代

“尼克,你为什么不诚实地谋生,从事RNA研究呢?”这是尼古拉斯·德里哈斯回忆起从艾伦·本迪奇(Aaron Bendich)那里听到的,后者是斯隆-凯特林癌症研究所核苷实验室的负责人。德里哈斯现在是石溪大学(Stony Brook University)的RNA分子生物学家,曾是本迪奇指导的博士后。德利哈斯尊敬本迪奇,认为他是一位创新的思想家,并将这位导师的话牢记于心。Delihas说:“我的研究生涯要归功于他。”

德里哈斯说,与本迪奇的谈话发生在1961年的某个时候。他说,当时,许多研究人员“认为RNA没有什么作用”。它将核糖体蛋白质连接在一起,起到核糖体支架的作用。也是在这一年,Sydney Brenner, François Jacob和Matthew Meselson发表了一种“中间信息载体”,他们称之为信使RNA2.它是将信息从细胞核中的DNA转移到细胞质中的蛋白质制造机制的分子。Delihas还记得对这一发现的兴奋。

这些具有历史意义的mRNA实验就发生在他旁边的一个实验室里,加州理工学院RNA生物学家米奇·古特曼说,“整个团队都来到加州理工学院,使用Meselson的技术来探索难以捉摸的‘短暂’中间产物。”实验包括感染大肠杆菌用噬菌体,它会关闭细菌蛋白质合成,并启动噬菌体蛋白质生产。细菌首先在含有重同位素的培养基中生长,然后感染,然后在含有轻同位素的培养基中生长。密度梯度离心纯化核糖体使他们发现标记,新合成的RNA和蛋白质。

德里哈斯注意到了像本迪奇这样的其他思想家。1969年,卡内基研究所的罗伊·布里顿(Roy Britten)和洛克菲勒大学的埃里克·戴维森(Eric Davidson)提出了“高等生物”基因组调控机制系统的理论,并提出“在分化的细胞类型中,相当大一部分功能基因可能是调控基因”。3.他们讨论了“激活rna”和“整合基因”。Guttman说,“在很多方面,这正是我们现在知道的许多lncrna所做的,”他指的是长非编码rna。在戴维森于2015年去世之前,古特曼经常与他交谈。

马蒂克说,戴维森在实验中观察到了两栖动物和海胆胚胎中的“信息rna”。在戴维森和布里顿1969年的论文中,当他们强调“高等”生物的大基因组时,他们注意到细胞核中转录本的多样性和以细胞特异性方式转录的重复序列的丰富性。马蒂克说,他们的想法受到François雅各布和雅克·莫诺的影响大肠杆菌的lac操纵子及其遗传算子、调控因子和结构组分的概念。马提克说,布里顿和戴维森的想法也受到了芭芭拉·麦克林托克基因调控模型的影响。虽然一些研究人员支持这种调控概念,但科学界普遍不接受,以蛋白质为基础的调控模式占主导地位。RNA调控是不必要的,正如马蒂克和阿马拉尔在他们的书中指出的那样,它被视为“异想天开”。

你好,1980年代

德里哈斯在获得博士后奖学金后加入了石溪大学。有一次工作期间,一位系主任告诉他,研究RNA毫无意义,但德里哈斯仍然对RNA的结构和功能着迷。在20世纪80年代,他的实验室首次提供了RNA基因和RNA转录物调节另一个基因表达的实验证据4.他说,这是一种“非常好的感觉”,也是一种荣幸。在20世纪80年代初,Delihas的同事Masayori Inouye找到他,请求他帮忙寻找大肠杆菌micF的成绩单。在长期的合作中,Delihas和他的团队做到了这一点。这项工作包括隔离和描述32P-labeledmicFRNA,一种93个核苷酸的ncRNA。他们放大了micF通过构建具有多个基因副本的质粒,从细菌中纯化RNA,并将其提取出来32P-labeledmicF从其他rna中提取。他们对该基因及其启动子进行了表征,并通过实验确定ncRNA在环境压力下抑制目标信使RNA的翻译。micF碱基对并与目标mRNA形成双工,即ompF,从而调节基因表达。这一发现早于发现第一个真核调节ncRNA,一种microRNA (miRNA)。

正如科罗拉多大学博尔德分校(University of Colorado Boulder)的约翰·里恩(John Rinn)所说,20世纪80年代,一些女性在那些ncrna“有名字”之前就发现了lncrna,尤其是雪莉·蒂尔曼(Shirley Tilghman)、丹尼斯·巴洛(Denise Barlow)和卡罗琳·布朗(Carolyn Brown)。“新奇的”lncRNA只是“他们发现的东西的放大版”。他说,随着20世纪90年代的发展,人们在基因组中发现了重要的rna。

1993年,Victor Ambros(左),Rosalind Lee(中)-现在都在马萨诸塞大学陈医学院-和Rhonda Feinbaum(右),现在在Lahey医院和医疗中心,发表了关于线虫中的lin-4.它是第一个真核非编码调控RNA,也是microRNAs类的创始成员。

这是20世纪90年代

RNA是一个入侵者:它“侵入了曾经被认为是蛋白质的领地”,来自威斯康星大学麦迪逊分校生物化学系的Marvin Wickens和Kathy Takayama在1994年关于线虫中的ncrna的评论中指出秀丽隐杆线虫5.侵入者RNA调节lin-14基因秀丽隐杆线虫它编码一种在发育早期很重要的核蛋白,然后被抑制。编码的两个rnalin-4基因表现为抑制表达lin-14在信使rna被制造和加工之后。现在在马萨诸塞大学医学院的维克多·安布罗斯(Victor Ambros)是其中一篇论文的主要作者,他说,从早期的工作开始,很明显,“短的是抑制因子”,它是由较长的前体加工而成的。

lin-4在西德尼·布伦纳的实验室里被鉴定出来。该团队和其他研究人员研究了该基因的突变如何使蠕虫发育出错。镇压lin-14的序列上的作用lin-14Wickens和Takayama指出,终止密码子和poly(A)尾巴之间的mRNA“被认为是不育的”。它拥有“一个新的调控rna家族等待被发现的诱人可能性”。威肯斯说,当时他“非常有信心”会发现其他rna,但他的感觉是,许多人“认为这只是一种奇怪的现象”秀丽隐杆线虫现象”。他们指出,随着在许多mrna的3’非翻译区发现调控元件,“对与它们相互作用的因素进行了攻击”,包括凝胶移位实验、紫外线交联和表达库筛选。他们写道,奇怪的、神秘的rna潜伏在文献中:被聚腺苷酸化和剪接的rna“似乎还没有被翻译”。他们指向基因Xist而且段H19以及具有未知功能的rna的海胆卵。他们问,这些rna是否可能是“怪诞的偏差,独一无二的畸变,就像费里尼电影中的人物一样?”它们不是奇奇怪怪的,而是“来自未知的巨大RNA世界的第一批使者”。

回顾2004年他们的工作lin-4而且lin-14,科学家们翻阅着他们的实验笔记本6.“我们很惊讶,”当时在达特茅斯医学院的安布罗斯和哈佛医学院的朗达·费恩鲍姆和罗莎琳德·李在谈到科学在1993年以来的十年里发生了怎样的变化时写道秀丽隐杆线虫出版。测序使用18英寸凝胶和放射自显影。蠕虫基因组只是一个零碎的集合,探索它的软件是“通过迟钝的行命令进入一个迟钝的中央主机”。其中一个人物的序列对齐是手工完成的,似乎花了几个月的时间。十年后,如果使用现代软件,这些任务将变得“微不足道”。最戏剧性的变化是在1993年,人们几乎没有兴趣lin-4或者它的“小RNA产物”,也就是说,“在一个非常小的朋友圈之外”。

正如东弗吉尼亚医学院的Aurora Esquela-Kerscher所指出的那样7lin-4是“miRNA超级家族的创始成员”。许多mirna已经在植物、动物和病毒基因组中被发现,它们似乎影响不同的细胞过程,包括增殖、凋亡、分化、代谢和免疫反应。研究lin-4秀丽隐杆线虫带来了对mirna机制的基本理解。mirna“比最初预测的更复杂”,它们在细胞核和细胞质中指导重要功能;它们以积极和消极的方式调节基因。“请继续关注——这些微小的rna可能会给我们带来更大的惊喜!”

miRNAs和这个lin-4洛约拉大学托妮·帕克实验室的博士后研究员梅根·林斯科特的工作也受到了影响。该实验室的研究重点是ncrna及其在人类生命周期中的调节作用。林斯考特探索了青春期的调节开关和激素调节。一旦研究人员发现一个miRNA可以调节数百种不同的mrna,这就开始了研究工作lin-4-“这完全改变了游戏规则,”林斯考特说。“突然之间,我们有了一个解释,即给定通路的多少不同部分可能受到单个非编码元素的影响。”她读了关于RNA转录本的羟甲基化,以及多层调控的概念,尤其是在RNA水平上,引起了她的兴趣。她已经了解了DNA的羟甲基化,所以RNA也可以被修饰,或者RNA本身可以帮助诱导羟甲基化的想法“是最终的先有鸡还是先有蛋的问题;不可能对非编码RNA领域不感兴趣。”Linscott说,大小是一个令人兴奋的miRNA特征。“谁能想到22个核苷酸序列能产生如此大的影响?”在大鼠大脑中,她和她的同事们已经证明了特定的mirna会受到衰老、激素和酒精的影响。ncrna本质上是作为小分子“开关”,这也暗示了它们作为治疗靶点的潜力。

对事物的迷恋

Maite Huarte说,那是2008年春天,她是哈佛大学的博士后研究员,研究染色质和组蛋白修饰剂。Maite Huarte现在是西班牙Clínica Navarra大学的研究中心Cima Universidad de Navarra的首席研究员。她和她的团队致力于lncrna和癌症中的基因调控。在哈佛,她遇到了约翰·里恩,他当时正在麻省理工学院和哈佛大学的布罗德研究所建立自己的实验室。里恩说,他与阿维夫·雷格夫(Aviv Regev)和埃里克·兰德(Eric Lander)是非正式的“布罗德集团”的一员。Huarte还遇到了当时是Lander实验室博士生的Guttman。她说,RNA测序还没有到来。平铺阵列从不同组织和不同发育阶段的小鼠基因组的基因间部分获得RNA表达数据。“这完全让我着迷,”当里恩告诉Huarte他们在非编码基因间区mrna样rna调控表达方面的结果时,Huarte说,他们将其命名为长非编码rna。

当时还不清楚为什么这些rna会被转录。“有很多事情要做,有很多令人兴奋的可能性,”她说。当里恩邀请她到他的实验室工作时,“我没有犹豫,”华特说。一周后,她在布罗德研究所做lncrna的北方印迹。“我对lncrna如何影响关键的生物学途径特别感兴趣,所以我开始研究它们在癌症中的作用p53反应。”p53是一种肿瘤抑制基因,在许多肿瘤类型中发生突变。

在Huarte看来,ncrna从垃圾领域转变为重要领域的最重要原因之一是实验室在lncrna功能丧失实验和使用RNA干扰(RNAi)等方法中所看到的结果。这些实验是“证明lncrna具有真正的细胞功能的关键”。很少lncrna在突变时表现出强烈的表型,但许多lncrna具有调节作用,可以通过研究它们如何改变基因表达来评估。她说,正交法对于获得对ncrna的深入了解很重要。“一些研究缺乏严谨性,这引起了一些研究人员的怀疑,我们面临的挑战是拿出尽可能好的证据来克服这种偏见。”

在2012年麻省理工学院的论文中,米奇·古特曼(Mitch Guttman)考虑了ncrna的历史,他将自己的职业生涯奉献给了这一领域。资料来源:S. Knemeyer, M. Guttman, J. Rinn

进入丛林

2012年,一个注释人类基因组的联盟——DNA元素百科全书(ENCODE)——发表了一系列论文8.例如,通过识别人类基因组的蛋白质编码区域和包括rna在内的调控元件,研究人员说,他们已经能够为80%的基因组分配生化功能,“特别是在充分研究的蛋白质编码区域之外。”批评人士指出9ENCODE在“功能”一词上“反复无常”,并将基因组分析与进化背景分离开来。默瑟总结了ENCODE的批评者,说他们声称ENCODE一直在“给一大堆垃圾测序”。他回忆说,辩论有时达到了白热化的程度。

默瑟第一次了解ncrna是在昆士兰大学攻读博士学位时,当时他和马蒂克一起工作,后来也在那所大学工作。当用平铺阵列扫描基因组时,“整个事情都亮了,”默瑟说。看起来“噪音太大”,也许是技术问题。RNA测序能够深入研究这些“噪音”,揭示表明基因结构的部分;转录因子和表观遗传因子的调控;以及通常只在某些细胞类型中表达的rna的丰度。他说,问题现在可以从关于垃圾和转录噪音的笼统陈述转变为探索ncrna功能的实用性。最近,默瑟的职业生涯转向了更多的翻译工作,他看到了基于rna的治疗方法的潜力。他是一篇即将发表的社区驱动论文的合著者《自然分子细胞生物学10lncrna相关的定义、功能和挑战。

在一本新书中,新南威尔士大学研究员John Mattick(左)和Insper研究员Paolo Amaral对非编码RNA研究的历史和未来进行了反思。资料来源:CRC出版社,泰勒和弗朗西斯集团

拟合的

Guttman说,在20世纪60年代和70年代,人们发现了许多没有被翻译成蛋白质的rna。这些rna有时被组合在一起作为异核rna (hnRNAs)。例如,它们中的许多都被很好地表征了,并且显示出它们永远不会离开细胞核,也不会与多核糖体结合。他说,回顾过去,这似乎是现在在分析中看到的早期证据。当时,一旦剪接被发现,许多科学家认为剪接解释了mRNA如何在细胞核中“翻转”。他说,对异核rna十年的研究已经使人们认识到它们“只是内含子”。“谜团解开了,对吧?”他说,人们并不无知;他们对这些ncrna有了解释,然后研究团队继续前进。进入20世纪80年代,大多数分子生物学家知道许多类型的rna:核糖体rna、tRNAs、mrna和小rna。 The research community knew that genes could have different properties, and “the ambiguities that existed early on started to be filled in.”

当Guttman开始他的博士研究时1112他说,在麻省理工学院和布罗德研究所的埃里克·兰德的实验室里,它是少数几个拥有新型Solexa测序仪的实验室之一,后来又有了Illumina仪器。他说,这是“基因组学历史上的一个巨大转折点”,因为研究界从基于桑格的仪器进行基因组测序转向了这种新技术。与当时的其他实验室一样,兰德实验室也使用该仪器来研究染色质的修饰。当Guttman修补数据集时,他发现了没有被注释为蛋白质编码基因的签名,这激发了他对ncrna的兴趣。

他说,当时和现在所缺乏的是一种理论,可以将RNA纳入更大的调控计划。古特曼说:“因为我们知道的所有例子都是一次性的。”例如,小的核rna会在剪接位点与内含子配对,以指导剪接机制。“除了剪接,你如何概括?他问道。小核仁RNA与45S前核糖体RNA碱基对;这是另一个“一次性”。XistGuttman说,这种lncRNA会使雌性哺乳动物X染色体中的两条X染色体中的一条沉默,这就提出了另一个外推的挑战。关于Xist他说,这是普遍接受的,但似乎仍然是例外。

马蒂克更喜欢“模范”这个词,而不是“例外”。的虫胶他说,Operon在过去和现在都被视为基因调控的“典范”。的ncRNAXist被认为是个例外。但考虑到它与染色质结构相互作用并影响基因表达的方式,他说,它是ncRNA的“典范”。马蒂克说,作为贝勒医学院(Baylor College of Medicine)的一名博士后,他“初出茅庐”,他回忆起1977年底与另一名贝勒博士后在酒吧里的一次深夜聊天。马蒂克正在研究脂肪酸合成酶复合物的结构和功能。“每个人都试图克隆他们最喜欢的基因,”他说。“His”有将近20千碱基长。他说,这需要进行多轮蔗糖密度梯度纯化,“这真的很艰难”。

马蒂克记得菲尔·夏普和里奇·罗伯茨的工作,他们在电子显微照片中显示,腺病毒rna与基因组杂交时,有些部分是环状的,或被拼接的。这些环是内含子,这一点并不被普遍认可:内含子被认为是垃圾。蛋白质编码基因一直是科学界关注的焦点。在贝勒大学的那次晚上谈话中,马蒂克回忆起他的博士后同事称内含子为“垃圾”。他们就此展开了辩论,此后又展开了许多其他的辩论。ncrna是Mattick的研究重点。在他的职业生涯中,他一直专注于调控rna的结构和作用。

马蒂克说,迄今为止,基因调控的历史是由以蛋白质为中心的思维形成的,这种思维被杰出人物的工作所打断。他的“英雄”名单包括布里顿、戴维森和麦克林托克。他说,这些科学家整合了rna的不同信息,“非常接近真相”。在他看来,对调控的其他解释,如细胞过程可以通过转录因子或其他调控蛋白的组合来解释的概念,是不成立的。确实,关于ncrna的发现对一些人来说“只是故事”,Mattick说。疑问可能仍然存在,有些方面仍然难以证明。马蒂克说:“这个领域正在发展。”