第二节 基因的结构
无论是核基因还是质基因,都能够储存、传递和表达遗传信息,也都可能发生突变,从而决定生物体的性状。基因之所以能够行使这些重要功能,是与它的结构有密切关系的。那么,基因的结构究竟是怎样的呢?
早在20世纪50年代,科学家们就开始了对基因内部结构的研究,但是直到70年代中期,随着DNA分析技术的发展,人们才对基因的结构有所认识。
原核细胞的基因结构
原核细胞的基因是由成百上千个核苷酸对组成的。组成基因的核苷酸序列可以分为不同的区段。在基因表达的过程中,不同区段所起的作用并不相同。有的区段能够转录为相应的信使RNA,进而指导蛋白质的合成,也就是说能够编码蛋白质,这样的区段叫做编码区(如图)。有的区段不能转录为信使RNA,也就是说不能编码蛋白质,这样的区段叫做非编码区。
非编码区是由编码区上游(如图中编码区左侧)和编码区下游(图中编码区右侧)的DNA序列组成的。非编码区虽然不能编码蛋白质,但是对于遗传信息的表达是不可缺少的。这是因为在非编码区上,有调控遗传信息表达的核苷酸序列,主要包括启动子、终止子等。
启动子位于编码区上游紧靠着转录起点的位置。在原核生物中一般只有数十个碱基对,它的主要功能是引导RNA聚合酶与基因的正确部位结合。也就是说,只有在启动子的作用下,RNA聚合酶才能准确地从转录起始点开始,沿着编码区正常地进行转录。终止子位于编码区下游紧靠着转录终点的位置。它的特殊的碱基排列顺序能够阻碍RNA聚合酶的移动,并使其从DNA模板链上脱离下来。
真核细胞的基因结构
真核细胞的基因也是由编码区和非编码区两部分组成的(如图)。在非编码区上,同样有具有调控作用的启动子和终止子,但是真核细胞的基因结构要比原核细胞的基因结构复杂。与原核细胞比较,真核细胞基因结构的主要特点是:编码区是间隔的、不连续的。也就是说,能够编码蛋白质的序列被不能够编码蛋白质的序列分隔开来,成为一种断裂的形式。其中,能够编码蛋白质的序列叫做外显子,不能够编码蛋白质的序列叫做内含子。
内含子的功能究竟是什么,目前并没有统一的认识。一种说法认为,内含子对基因的转录具有某种调控作用;另一种说法认为,内含子在生物进化的某一个阶段曾起过重要作用,比如把编码同一种功能蛋白质的外显子连锁在一起。但是,现在它只是作为一种进化过程中的残存物而存在于DNA序列中。
在真核细胞中,不同种类的蛋白的基因所含的外显子和内含子的数目是不同的,长度也有差别。例如,人的血红蛋白中,有一种蛋白质叫做β-珠蛋白,它的基因有1700个碱基对,其中有3个外显子和2个内含子,能够编码146个氨基酸。人的一种凝血因子的基因,在它的186000个碱基对中,有26个外显子和25个内含子,能够编码2552个氨基酸。一般来说,在真核细胞中,每一个能够编码蛋白质的基因都含有若干个外显子和内含子。
算β-珠蛋白基因和凝血因子基因中外显子的碱基对在整个基因碱基对中所占的比例。从这个比例中你能得出什么结论?
一、判断题
1.原核细胞的基因结构中没有内含子,只有外显子。 ( )
2.终止子是一种转录终止的信号,因此,它的DNA序列与编码区的终止密码TAA相同。 ( )
3.基因结构中的非编码序列通常是具有调控作用的。 ( )
4.真核细胞基因结构中的非编码序列是位于编码区上游和下游的核苷酸序列。 ( )
5.真核细胞的一个基因只能编码一种蛋白质,因此,它的编码序列只含有一个外显子和一个内含子。( )二、简答题
比较原核细胞与真核细胞基因结构的主要相同点和不同点。
未来医学、生物学的奠基工程——人类基因组计划
现代医学的发展已经使人们根治了天花,战胜了霍乱,控制了麻风病等一些过去被判为不治之症的疾病,使人类在征服自身疾病方面迈上了一个新的台阶。可是,人类在对自身的认识和保护方面,与现代科学技术在信息、激光、航天等方面的辉煌成就相比,却有许多不如人意之处。比如,肿瘤、心血管疾病日益成为人类死亡的主要疾病;全世界还有20%~50%的人备受各种慢性疾病的折磨;目前,我国还有11%的人患有高
血压,2.5%的人智力低下。实际上,人类的许多生理和病理现象都与基因的结构和功能有关。人类基因组计划(HGP,Human
Genome Project),就是在基因水平上揭开人体奥秘的一个庞大的工程计划。这个计划虽然需要耗资30亿美元,但它对于奠定21世纪医学、生物学发展的基础具有重要而深远的意义。因此,科学家们将这个工程计划与曼哈顿原子弹计划和阿波罗登月计划相媲美,把它们共同称为20世纪人类自然科学史上三个最伟大的工程计划。人类基因组是指人体DNA分子所携带的全部遗传信息。人的单倍体基因组是由23条双链的DNA分子组成,上边有3×109个碱基对,估计有10万个基因。人类基因组计划就是研究人类的基因组,即分析人类基因组的核苷酸序列。这个计划的设想是1990年由美国著名的生物学家、诺贝尔奖获得者伯克提出来的。其主要内容包括绘制人类基因组的四张图,即遗传图、物理图、序列图和转录图。绘制这四张图好比是建立一个“人体地图”,沿着地图中一个个路标,如“遗传标记”、“物理标记”等,可以一步步地找到每一个基因,搞清楚每一个基因的核苷酸序列。
由于当代高新技术的飞速发展,特别是DNA克隆技术和DNA测序技术的发展,为研究人类基因组提供了可能。从目前的进展来看,计划中的某些图可望提前完成。科学家们认识到,人类基因组研究的理论与技术上的进展,对于各种疾病,尤其是各种遗传病的诊断、治疗具有划时代的意义;对于进一步了解基因表达的调控机制、细胞的生长、分化和个体发育的机制,以及生物的进化等也具有重要的意义。同时,这一计划的实施,将推动生物高新技术的发展,并产生巨大的经济效益。
我国地域辽阔,由于历史、地理、经济、文化等原因,形成了中华民族的56个民族群体,在这些群体中,有较多的隔离度高的大家系,以及丰富的遗传病家系病例。这些都是人类基因组多样性研究弥足珍贵的资源和材料(据报道,国外根据从南大西洋的一个岛屿和我国浙江省象山县获得的哮喘病家系基因组,定位了与哮喘相关的两个基因的位点)。目前我国十分重视人类基因组的研究,由16个科研单位联合开展的中华民族基因组若干位点基因结构的研究,已经取得了一批具有国际先进水平的研究成果。