生物|什么是基因?
基因(遗传因子)是具有遗传效应的DNA片段(部分病毒如烟草花叶病毒、HIV的遗传物质是RNA)。基因支持着生命的基本构造和性能。储存着生命的种族、血型、孕育、生长、凋亡等过程的全部信息。环境和遗传的互相依赖,演绎着生命的繁衍、细胞分裂和蛋白质合成等重要生理过程。生物体的生、长、衰、病、老、死等一切生命现象都与基因有关。它也是决定生命健康的内在因素。因此,基因具有双重属性:物质性(存在方式)和信息性(根本属性)。
带有遗传讯息的DNA片段称为基因,其他的DNA序列,有些直接以自身构造发挥作用,有些则参与调控遗传讯息的表现。组成简单生命最少要265到350个基因。(这涉及到了基因工作组的力量,人类的基因工作组与果蝇的基本相似)
人体基因组图谱好比是一张能说明构成每个人体细胞脱氧核糖核酸(DNA)的30亿个碱基对精确排列的“地图”。科学家们认为,通过对每一个基因的测定,人们将能够找到新的方法来治疗和预防许多疾病,如癌症和心脏病等。该图非常形象地把基因家族的基因片段描绘出来。
一、主要特征
基因--有遗传效应的DNA片段,是控制生物性状的基本遗传单位。
人们对基因的认识是不断发展的。19世纪60年代,遗传学家孟德尔就提出了生物的性状是由遗传因子控制的观点,但这仅仅是一种逻辑推理的产物。20世纪初期,遗传学家摩尔根通过果蝇的遗传实验,认识到基因存在于染色体上,并且在染色体上是呈线性排列,从而得出了染色体是基因载体的结论。
20世纪50年代以后,随着分子遗传学的发展,尤其是沃森和克里克提出双螺旋结构以后,人们才真正认识了基因的本质,即基因是具有遗传效应的DNA片段。研究结果还表明,每条染色体只含有1~2个DNA分子,每个DNA分子上有多个基因,每个基因含有成百上千个脱氧核苷酸。由于不同基因的脱氧核苷酸的排列顺序(碱基序列)不同,因此,不同的基因就含有不同的遗传信息。1994年中科院曾邦哲提出系统遗传学概念与原理,探讨猫之为猫、虎之为虎的基因逻辑与语言,提出基因之间相互关系与基因组逻辑结构及其程序化表达的发生研究。
二、基因特点
基因有两个特点,一是能忠实地复制自己,以保持生物的基本特征;二是基因能够“突变”,突变绝大多数会导致疾病,另外的一小部分是非致病突变。非致病突变给自然选择带来了原始材料,使生物可以在自然选择中被选择出最适合自然的个体。
含特定遗传信息的核苷酸序列,是遗传物质的最小功能单位。除某些病毒的基因由核糖核酸(RNA)构成以外,多数生物的基因由脱氧核糖核酸(DNA)构成,并在染色体上作线状排列。基因一词通常指染色体基因。在真核生物中,由于染色体都在细胞核内,所以又称为核基因。位于线粒体和叶绿体等细胞器中的基因则称为染色体外基因、核外基因或细胞质基因,也可以分别称为线粒体基因、质粒和叶绿体基因。
在通常的二倍体的细胞或个体中,能维持配子或配子体正常功能的最低数目的一套染色体称为染色体组或基因组,一个基因组中包含一整套基因。相应的全部细胞质基因构成一个细胞质基因组,其中包括线粒体基因组和叶绿体基因组等。原核生物的基因组是一个单纯的DNA或RNA分子,因此又称为基因带,通常也称为它的染色体。
基因在染色体上的位置称为座位,每个基因都有自己特定的座位。在同源染色体上占据相同座位的不同形态的基因都称为等位基因。在自然群体中往往有一种占多数的(因此常被视为正常的)等位基因,称为野生型基因;同一座位上的其他等位基因一般都直接或间接地由野生型基因通过突变产生,相对于野生型基因,称它们为突变型基因。在二倍体的细胞或个体内有两个同源染色体,所以每一个座位上有两个等位基因。如果这两个等位基因是相同的,那么就这个基因座位来讲,这种细胞或个体称为纯合体;如果这两个等位基因是不同的,就称为杂合体。在杂合体中,两个不同的等位基因往往只表现一个基因的性状,这个基因称为显性基因,另一个基因则称为隐性基因。在二倍体的生物群体中等位基因往往不止两个,两个以上的等位基因称为复等位基因。不过有一部分早期认为是属于复等位基因的基因,实际上并不是真正的等位,而是在功能上密切相关、在位置上又邻接的几个基因,所以把它们另称为拟等位基因。某些表型效应差异极少的复等位基因的存在很容易被忽视,通过特殊的遗传学分析可以分辨出存在于野生群体中的几个等位基因。这种从性状上难以区分的复等位基因称为同等位基因。许多编码同工酶的基因也是同等位基因。
属于同一染色体的基因构成一个连锁群(见连锁和交换)。基因在染色体上的位置一般并不反映它们在生理功能上的性质和关系,但它们的位置和排列也不完全是随机的。在细菌中编码同一生物合成途径中有关酶的一系列基因常排列在一起,构成一个操纵子(见基因调控);在人、果蝇和小鼠等不同的生物中,也常发现在作用上有关的几个基因排列在一起,构成一个基因复合体或基因簇或者称为一个拟等位基因系列或复合基因。
三、相互作用
生物的一切表型都是蛋白质活性的表现。换句话说,生物的各种性状几乎都是基因相互作用的结果。所谓相互作用,一般都是代谢产物的相互作用,只有少数情况涉及基因直接产物,即蛋白质之间的相互作用。
四、主要类别
60年代初F.雅各布和J.莫诺发现了调节基因。把基因区分为结构基因和调节基因是着眼于这些基因所编码的蛋白质的作用:凡是编码酶蛋白、血红蛋白、胶原蛋白或晶体蛋白等蛋白质的基因都称为结构基因;凡是编码阻遏或激活结构基因转录的蛋白质的基因都称为调节基因。但是从基因的原初功能这一角度来看,它们都是编码蛋白质。
根据原初功能(即基因的产物)基因可分为:
①编码蛋白质的基因。包括编码酶和结构蛋白的结构基因以及编码作用于结构基因的阻遏蛋白或激活蛋白的调节基因;
②没有翻译产物的基因。转录成为RNA以后不再翻译成为蛋白质的转移核糖核酸(tRNA)基因和核糖体核酸(rRNA)基因;
③不转录的DNA区段。如启动区、操纵基因等等。前者是转录时RNA多聚酶开始和DNA结合的部位;后者是阻遏蛋白或激活蛋白和DNA结合的部位。已经发现在果蝇中有影响发育过程的各种时空关系的突变型,控制时空关系的基因有时序基因、格局基因、选择基因等(见发生遗传学)。
一个生物体内的各个基因的作用时间常不相同,有一部分基因在复制前转录,称为早期基因;有一部分基因在复制后转录,称为晚期基因。一个基因发生突变而使几种看来没有关系的性状同时改变,这个基因就称为多效基因。
数目 不同生物的基因数目有很大差异,已经确知RNA噬菌体MS2只有3个基因,而哺乳动物的每一细胞中至少有100万个基因。但其中极大部分为重复序列,而非重复的序列中,编码肽链的基因估计不超过10万个。除了单纯的重复基因外,还有一些结构和功能都相似的为数众多的基因,它们往往紧密连锁,构成所谓基因复合体或叫做基因家族。
1.等位基因:
位于一对同源染色体的相同位置上控制某一性状的不同形态的基因。不同的等位基因产生例如发色或血型等遗传特征的变化。等位基因控制相对性状的显隐性关系及遗传效应,可将等位基因区分为不同的类别。在个体中,等位基因的某个形式(显性的)可以比其他形式(隐性的)表达得多。等位基因(gene)是同一基因的另外“版本”。例如,控制卷舌运动的基因不止一个“版本”,这就解释了为什么一些人能够卷舌,而一些人却不能。有缺陷的基因版本与某些疾病有关,如囊性纤维化。值得注意的是,每个染色体(chromosome)都有一对“复制本”,一个来自父亲,一个来自母亲。这样,我们的大约3万个基因中的每一个都有两个“复制本”。这两个复制本可能相同(相同等位基因allele),也可能不同。下图显示的是一对染色体,上面的基因用不同颜色表示。在细胞分裂过程中,染色体的外观就是如此。如果比较两个染色体(男性与女性)上的相同部位的基因带,你会看到一些基因带是相同的,说明这两个等位基因是相同的;但有些基因带却不同,说明这两个“版本”(即等位基因)不同。
2.拟等位基因(pseudoalleles):
表型效应相似,功能密切相关,在染色体上的位置又紧密连锁的基因。它们象是等位基因,而实际不是等位基因。
传统的基因概念由于拟等位基因现象的发现而更趋复杂。摩根学派在其早期的发现中特别使他们感到奇怪的是相邻的基因一般似乎在功能上彼此无关,各行其是。影响眼睛颜色、翅脉形成、刚毛形成、体免等等的基因都可能彼此相邻而处。具有非常相似效应的“基因”一般都仅仅不过是单个基因的等位基因。如果基因是交换单位,那就绝不会发生等位基因之间的重组现象。事实上摩根的学生在早期(1913;1916)试图在白眼基因座位发现等位基因的交换之所以都告失败,后来才知道主要是由于试验样品少。然而自从斯特体范特(1925)提出棒眼基因重复的不均等交换学说以及布里奇斯(1936)根据唾液腺染色体所提供的证据支持这学说之尼,试图再一次在仿佛是等位基因之间进行重组的时机已经成熟。Oliver(1940)首先取得成功,在普通果蝇的菱形基因座位上发现了等位基因不均等交换的证据。两个不同等位基因(Izg/Izp)被标志基因拚合在一起的杂合子以0.2%左右的频率回复到野生型。标志基因的重组证明发生了“等位基因”之间的交换。
非常靠近的基因之间的交换只能在极其大量的试验样品中才能观察到,由于它们的正常行为好像是等位基因,因此称为拟等位基因(Lewis,967)。它们不仅在功能上和真正的等位基因很相似,而且在转位(transposition)后能产生突变体表现型。它们不仅存在于果蝇中,而且在玉米中也已发现,特别在某些微生物中发现的频率相当高。分子遗传学对这个问题曾有很多解释,然而由于目前对真核生物的基因调节还知之不多,所以还无法充分了解。
位置效应的发现产生了深刻影响。杜布赞斯基在一篇评论性文章中曾对此作出下面的结论;“一个染色体不单是基因的机械性聚合体,而且是更高结构层次的单位……染色体的性质由作为其结构单位的基因的性质来决定;然而染色体是一个合谐的系统,它不仅反映了生物的历史,它本身也是这历史的一个决定因素”(Dobzhaansky,1936:382)。
有些人并不满足于这种对基因的“串珠概念”的温和修正。自从孟德尔主义兴起之初就有一些生物学家(例如Riddle和Chiid)援引了看来是足够份量的证据反对基因的颗粒学说。位置效应正好对他们有利。Goldschmidt(1938;1955)这时变成了他们的最雄辩的代言人。他提出一个“现代的基因学说”(1955:186)来代替(基因的)颗粒学说。按照他的这一新学说并没有定位的基因而只有“在染色体的一定片段上的一定分子模式,这模式的任何变化(最广义的位置效应)就改变了染色体组成部分的作用从而表现为突变体。”染色体作为一个整体是一个分子“场”,习惯上所谓的基因是这个场的分立的或甚至是重叠的区域;突变是染色体场的重新组合。这种场论和遗传学的大量事实相矛盾因而未被承认,但是像Goldschmidt这样一位经验丰富的知名遗传学家竟然如此严肃地提出这个理论这件事实就表明基因学说还是多么不巩固。从1930年代到1950年代所发表的许多理论性文章也反映了这一点(Demerec,1938,1955;Muller,1945;Stadler,1954)。
3.复等位基因:
因如果存在多种等位基因的形式,这种现象就称为复等位基因(multiple allelism)。任何一个二倍体个体只存在复等位基中的二个不同的等位基因。
在完全显性中,显性基因中纯合子和杂合子的表型相同。在不完显性中杂合子的表型是显性和隐性两种纯合子的中间状态。这是由于杂合子中的一个基因无功能,而另一个基因存在剂量效应所致。完全显性中杂合体的表型是兼有显隐两种纯合子的表型。此是由于杂合子中一对等位基因都得到表达所致。
比如决定人类ABO血型系统四种血型的基因IA、IB、i,每个人只能有这三个等位基因中的任意两个。