此页已存档,不再更新

什么是基因?共线性和转录单位

作者:Leslie A. Pray博士©2008 Nature Education
引用:祈祷,L。 (2008)什么是基因?共线性和转录单位。自然教育 1(1: 97
电子邮件
1958年,弗朗西斯·克里克(Francis Crick)的序列假说最终为“什么是基因”这个问题提供了答案。为什么这个定义现在被认为过于简单化了呢?
Aa Aa Aa

在20世纪早期,科学家们知道基因是的,但他们不知道自己是什么。弗朗西斯·克里克是三维双螺旋结构的发现者之一DNA他是最早提出基因是一种物质的人之一线性核苷酸序列,每个基因编码一个蛋白质.克里克称这一提议为序列假说(Crick, 1958);此后,其他科学家将其称为基因串假说。用克里克的话来说,这一假说“假设了一块的特异性。核酸仅由其碱基序列表示,该序列是?的(简单)代码氨基酸特定蛋白质的序列。”克里克坦率地承认,他的假设只是一个“完全缺乏证据”的假设。然而,为了证明他的推测是合理的,克里克引用了一些由美国分子生物学家西摩·本泽进行的关于噬菌体的实验工作。用克里克的话来说,本泽尔的工作证明,“一个功能性基因由许多严格排列的位点组成。以线性顺序(克里克,1958;原来斜体)。

今天,科学家们不再谈论序列假说。相反,这个概念核苷酸序列(基因)直接决定氨基酸序列被称为同线性(图1)科学家们已经证实,在许多病毒中,像Benzer研究的病毒一样,共线性是一种常见的现象细菌.然而,事实证明,共线性是例外,而不是规则真核生物的基因组。

一个示意图显示转录和翻译过程的三个基本步骤。首先,将双链DNA分子转录成单链MRNA分子,然后将MRNA分子翻译成多肽链。图表旁边的文本框表明,DNA中连续的核苷酸序列编码蛋白质中连续的氨基酸序列,共线性是指基因中核苷酸的数量与蛋白质中氨基酸的数量成正比。
图1:核苷酸和氨基酸序列的共线性。
共线性是基因中的核苷酸序列决定蛋白质中的氨基酸序列的概念。
©2014自然教育改编自本杰明·皮尔斯。遗传学:一种概念方法版权所有。查看使用条款

替代共线性

DNA和氨基酸序列的共线性并不像克里克所提出的那样简单,这一发现是最早的线索之一核糖核酸拼接20世纪70年代。英国分子化学家理查德·罗伯茨(Richard Roberts)和美国分子生物学家菲利普·夏普(Philip Sharp)分别用普通感冒病毒作为实验系统,发现基因可以沿着染色体分裂成几个片段基因组(大山大山et al。, 1977;周润发et al。, 1977)。然后,两位科学家使用电子显微镜观察到,一个信使RNA (信使核糖核酸分子杂交的不是一段DNA,而是多达四个或更多不连续的DNA片段(图2)。

罗伯茨和夏普还指出,遗传物质实际上是分解的,然后在蛋白质合成的某些点上重新形成自己。具体来说,编码蛋白质产生的DNA片段被称为外显子,而散布在外显子之间的非编码片段被称为内含子。在剪接过程中转录(即,从DNA模板合成RNA),内含子被移除,外显子被连接或拼接在一起。

罗伯茨和夏普的发现不仅对a的概念提出了严重的质疑基因作为一个连续的,明确划分的DNA片段,但它们也导致了一系列的研究活动,科学家们好奇是否在其他地方也是如此物种.正如其他研究人员很快发现的那样,基因结构和剪接不连续RNA加工是大多数真核生物的常态,而不是例外。一些脊椎动物的基因包含多达50个外显子,而外显子通常只占基因转录区域的一小部分。例如,在一项早期的剪接研究中,该研究涉及对鸡的内含子-外显子模式的检查卵清蛋白基因,斯坦et al。(1980)测量了8个长度在20到181个碱基对之间的外显子和7个长度在264到1150个碱基对之间的内含子。自那项研究以来,科学家们在一些物种中发现了长达5万个碱基对或更多的内含子。


由任何给定的内含子-外显子序列编码的最终蛋白质产物在结构上也有所不同,这取决于在RNA加工过程中哪些外显子被拼接在一起。这就是所谓的“可变剪接如图3所示。此后,科学家们还了解到真核细胞已经进化出另一种“替代”mRNA加工途径:使用多个3'裂解位点在单个外显子中。(每个内含子都有一个5' and3'剪接位点)。如图3所示,最终结果与选择性剪接相同:单个蛋白质编码基因产生不同的mRNA分子。显然,与单一基因编码单一蛋白质的传统观念相反,一段连续的DNA片段可以编码多个mRNA分子,并最终编码多种蛋白质产物。

转录单位而不是基因

考虑到大量的DNA似乎几乎没有蛋白质编码能力,而且这些DNA中的大部分都位于功能基因的中间(如内含子),一些科学家更喜欢用“转录单位”而不是“基因”来思考。转录单位是DNA的一个线性序列,从A延伸转录起始位点到一个转录停止位点(图4)。


启动子这是一个DNA序列上游在RNA编码区,作为一个指示在哪里和在哪个方向转录应该进行。启动子实际上并没有转录;它的作用纯粹是监管。虽然启动子在真核生物中差异很大,但也有一些共同的特征。例如,大多数启动子位于基因的上游转录单位转录是在上游进行的下游方向),并且大多数包含被称为一个TATA盒;这是一个被所谓的TATA结合蛋白识别和结合的序列。TATA结合蛋白帮助定位RNA聚合酶机械和启动转录。一些启动子与其他类型的称为增强子的调控序列协同工作,增强子有时位于编码序列本身的上游或下游几千个碱基处,甚至在内含子内。由于DNA分子在空间中弯曲的方式,这两个序列能够相互作用,使彼此相距很远的部分能够相互作用(通过DNA结合蛋白)。增强子区域是被称为激活子的蛋白质的结合位点(图5)。与启动子结合以调节转录的蛋白质被称为转录因子。RNA编码区是转录单元的主要组成部分,包含实际的外显子和内含子。的《终结者》转录单元末端的核苷酸序列与RNA编码区一起转录。终结者扮演着减速带的角色;只有在这个区域转录完成后转录才会停止。

科学家最近发现,一些mRNA分子是由来自多个转录单位的外显子通过一个过程编码的被称为trans-splicing.事实上,2005年,一组欧洲研究人员估计,人类体内约有4%至5%的串联转录单位(即不同但相邻的转录单位)被转录在一起,形成单一的“嵌合”mRNA分子(Parraet al。, 2005)。科学家们不确定这是如何发生的。一些人推测,转录覆盖了第一个转录终止子,直到到达第二个终止位点才停止;另一些人则怀疑这两种转录本是独立形成的,然后拼接在一起形成嵌合的mRNA分子。

示意图显示了转录起始过程中的四个重要步骤。在每一步中,一段DNA被描绘成一个水平的灰色矩形。矩形上的阴影区域代表调控和核心启动子区域。矩形上的小阴影矩形片段代表TATA核苷酸序列。转录起始位点在DNA分子上用绿色箭头表示。RNA聚合酶和转录因子用彩色形状表示。DNA上的TATA盒募集TFIID和TBP后,RNA聚合酶全酶与DNA结合。全酶中的每个蛋白质与DNA的不同部分相互作用以增强转录。
图5:转录起始时的启动子。
为了准备转录过程,RNA聚合酶在TATA结合蛋白的帮助下定位在DNA上。TATA结合蛋白结合TATA盒子,一个包含部分启动子的DNA序列。
©2014自然教育改编自本杰明·皮尔斯。遗传学:一种概念方法版权所有。查看使用条款

基因区域划分

似乎科学家对基因组了解得越多基因表达,他们似乎就越不能确定核苷酸序列中单个基因实际开始和结束的位置;事实上,要确定基因是否存在实际的离散核苷酸起始点和终止点似乎越来越困难了。这种复杂性使得科学家们很难就基因究竟是什么达成一致。至少,科学家们现在知道克里克最初的序列假设过于简单,至少对真核生物来说是如此。基因并不是线性的DNA序列,与它们的蛋白质对应物直接一对一对应。

此外,科学家们现在知道,并非所有转录的RNA分子或转录本最终都被翻译成蛋白质产物。例如,在对小鼠基因组的研究中,研究人员发现,多达63%的基因组被转录,但只有约1%至2%被翻译成功能性蛋白质产物(FANTOM Consortium)et al。, 2005)。因此,不仅共线性的概念过于简单化,而且所有基因编码蛋白质的概念也过于简单化。许多编码其他类型的分子,比如tRNA核糖体rna它们具有重要的已知细胞功能。其他非蛋白编码rna在多个水平上调节基因表达,还有一些转录物的功能未知。

参考资料及推荐阅读


毕德乐,郭文伟,李志明。生物化学反应的遗传控制脉孢菌美国国家科学院院刊27, 499-506 (1941)

伯杰特,s.m.,.腺病毒2晚期mRNA 5'末端的剪接片段。美国国家科学院院刊74, 3171-3175 (1977)

周立泰,.腺病毒2号信使RNA 5'末端的惊人序列排列。细胞12, 1-8 (1977)

克里克,F.蛋白质合成。大分子的生物复制:实验生物学学会研讨会12, 138-162 (1958)

幽灵财团,.哺乳动物基因组的转录景观。科学309科学通报,1559-1563 (2005)doi:10.1126/science.1112014

Parra, G。,et al。串联嵌合作为增加人类基因组蛋白质复杂性的一种手段。基因组研究16, 37-44 (2006)

斯坦,j.p。et al。卵泡样介入序列指定功能域并产生蛋白质多态性。细胞21, 681-687 (1980)

电子邮件

文章历史

关闭

国旗不合适

此内容目前正在建设中。

连接
连接 发送消息


自然教育 自然教育之家了解更多关于教师页面学生页面反馈



核酸结构与功能

视觉浏览

关闭
Baidu
map