Literature
Home行业资讯临床快报遗传与基因组

从绘“天书”到给“天书”加注

来源:大众科技报
摘要:2000年6月26日,中、美、日、德、法、英等6国科学家宣布首次绘成人类基因组“工作框架图”,这标志着人类在解读自身“生命之书”的路上迈出了重要一步。“人类基因组计划”为解析生命的奥秘提供了最根本的信息,是破译生命奥秘的基础。人类基因组草图诞生10周年,回首这10年,草图绘就后的变化或许并不足为奇,但这恰好......

点击显示 收起

  2000年6月26日,中、美、日、德、法、英等6国科学家宣布首次绘成人类基因组“工作框架图”,这标志着人类在解读自身“生命之书”的路上迈出了重要一步。中国是参与完成这项工作草图绘制工作的唯一发展中国家。



        “人类基因组计划”为解析生命的奥秘提供了最根本的信息,是破译生命奥秘的基础。人类基因组草图诞生10周年,回首这10年,草图绘就后的变化或许并不足为奇,但这恰好说明,人类要了解自身是何等不易。正如美国加州大学生物学家戴维·豪斯勒所言,在第一个10年所发生的仅仅是序曲,人类要了解基因组的全部意义,还有很长的路要走。  

基因揭示生物之谜



        人们虽然很久以前就已经知道遗传现象,但是遗传机制一直不清楚。到了20世纪,我们逐渐认识到这个遗传因子就是基因,即DNA,并进一步发现了它的物质组成和空间结构。正是由于基因结构的揭示,使得我们能够深入地解释和研究这样一个非常重大的生命现象。



        随着研究的逐步深入,基因本身的内涵也不断地发展,最后为毕其功于一役,终于启动了人类基因组计划。这样一个发展过程,可以说孕育了一个世纪,就是20世纪这个刚刚过去的被称为“基因的世纪”。



        无论是研究科学史的还是研究文明史的,都认为20世纪确实是一个非常重要的世纪——“基因的世纪”。孟德尔基因遗传定律是在19世纪中叶被发现的,但是发现之后30多年都无人问津。在1900年,也就是20世纪刚刚打开历史城门的时候,孟德尔定律被再次发现,而且被3个科学家、3个科学团队同时发现。



        在此之后,衍生出一系列的围绕基因研究所展开的重大历史事件,包括在上世纪70年代代表遗传工程的基因工程。早在70年代,我国召开第一次全国科学大会的时候,遗传工程就被列为八大工程的第二大工程,可以看出其确确实实在20世纪孕育了一个世纪的发展。在这个过程中两个非常重要的人物,一个是詹姆斯·沃森,还有一个是弗兰西斯·格里克。他们揭示了DNA结构,阐明了DNA作为遗传物质载体的这样一个结构基础。应该说,这是一个划时代的科学发现,而且被誉为20世纪,甚至人类有史以来的少数几个最重大的科学发现之一。正如沃森所说,这个结构最重要的意义是以分子的组织方式,直接揭示了两个最古老的生物之谜。



        第一个是遗传信息的储存,就是说父亲和母亲传给我们的遗传信息可以储存,这是第一个问题;第二个是复制,如果只能储存而不能复制、传递,那么实际上生命的代际转移就无从进行,所以遗传信息的储存和复制,是两个非常古老的生命问题。正是由于格里克和沃森发表在1953年《自然》杂志上的一篇非常短小的文章,揭示了万古之谜,也就是遗传信息的组成、复制这样一个谜底。正是由于这样一个发现,使得DNA分子真正成为生物连续性的基础。



数字化的生命指令



        遗传信息的储存和复制,是使得生命能够延续、一代一代传递的根本物质基础,这个基础对整个生命世界来讲是非常重要而难得的。但是,就这么一个双螺旋的结构,真的可以进行遗传信息的储存和复制吗?



        在提出这样一个结构一个月之后,他们再次提出,DNA链中碱基的排列顺序很可能就是携带遗传信息的密码。这在当时是一个大胆的假设,因为在1953年提出这样一个假设之后,经过20年的时间科学家们才逐步认识到,遗传信息的密码究竟是怎么回事,正是由于碱基排列顺序的假设,才有后来的基因组计划,所以这是一个非常重大的科学假设。



        围绕这个科学假设,非常重要的一点就是遗传信息的指令是数字化的。正是由于这样一种数字化的现象和物质基础的存在,使得过去我们一直认为模糊的生物事件呈现出了指令化和数字化。



        现今计算机的基本语言是“0”和“1”,两者选一,而遗传信息是碱基ATGC有4种选择,很显然要比计算机的指令更为复杂。ATGC的4种展现形式及其排列顺序,使之成为连接生命科学和信息科学的桥梁。  



        也正是基于这样一个基础,一种序列化的方式,才使得人类能够像细胞那样阅读基因的信息,这仍然是詹姆斯·沃森说的。这句话说起来很简单,却非常伟大、非常豪迈。就是说,人类的基因组大概有30亿对碱基,这是一个天文数字,正由于这种序列化现象的存在,使得过去我们可以看到的这个就像工厂车间大规模生产的方式,可以有效地用于生命科学研究。这一点在科学史上,尤其在生命科学史上,是难以想象的。



        我们知道,细胞非常之小,但是阅读基因组信息非常迅速,由于DNA序列的存在及其测定技术的出现,才使得人类能够像细胞那样,阅读数以万计、数以亿计的遗传信息。我们可以看到,“人类基因组计划”为解析生命的奥秘提供了最根本的信息,是破译生命奥秘的基础。“人类基因组计划”的形成和实施是基于基因序列,没有这个序列作为桥梁把计算机技术引入,使得大规模的数据产出和分析成为可能,那么这样一个伟大的科学计划实际上是不可能进行的。



开创“基因组时代”



        众所周知,元素周期表和元素周期律的揭示奠定了20世纪物理学和化学的研究和发展基础。  



        那么,将来人类基因组的序列图会是一个什么情况呢?我们可以自信地说,它将会奠定和极大促进21世纪乃至更远时期内生命科学和生物技术以及未来医学的发展。“人类基因组计划”是划时代的,是史无前例的,而且将会在未来历史发展过程中,对整个人类文明、人类世界发展起到非常重要的推动作用。



        “人类基因组计划”的总协调人弗兰西斯·科林斯在一次重要会议上指出:人类基因组计划开创了一个时代,即“基因组时代”。的确,在“人类基因组计划”实行之后,形成了一个新的文明时代和一个新的科学时代,这个是一点不假的,现在这已经成为普遍的共识。



        但是,我们也应该非常冷静地看到,“人类基因组计划”进行之初,人们普遍预期该计划完成之后,人类对自己的生老病死的机制,将会形成一种全面的揭示,人类所面临的一些重大疾病也将会迎刃而解。



        事实上,“人类基因组计划”已在2001年提供了人体基因组草图,2004年宣布全面完成。然而,在“人类基因组计划”完成之后,可以看到现在我们对一些重大疾病的认识仍然非常不足。在此过程中,社会各界对“人类基因组计划”实施前的预期与完成后的效果,形成了一个极大的反差。



        也就是说,开始的时候,本以为“人类基因组计划”完成之后,人类生老病死的机制就会被揭示,人类一系列重大疾病就可以得到解决,人类的长寿很快就能够实现。可后来发现,这个计划完成之后,好像并没有这样一个重大的改变。



        科学家们逐步地认识到,“人类基因组计划”好像一本天书,我们原本希望把这本天书印出来,就能够直接地解读出来,就能够认识它、读懂它,后来发现并不是如此简单。



        随着大量生物体全基因组序列的揭示,人们发现,仅从基因组序列的角度仍然无法完整、系统地阐明生物体的功能。人类基因组序列图就像一幅“天书”,要想“解密天书”,读懂其中的信息密码与遗传语言,真正揭开生命现象的奥秘,就必须系统认识基因组的产物——蛋白质组。  



“盲人摸象”的启示



        蛋白质的另外一个特点就是其功能的群体性。  蛋白质通过一种群体的功能,才使得生命体拥有非常复杂、非常高效的化学系统、更好的催化性能和工作效能。还有一点是基于它的整体性。中国有一句成语叫“盲人摸象”,当盲人摸到大象不同部分的时候,可以把它当做是不同的东西。我们只有知道一个整体之后,才知道它是一头象,但在认识各个部分的时候,很难清楚地认识到它是一头象。实际上,蛋白质组也是这样。蛋白质组是一个整体的概念,你必须通过对整体的认识,然后才可能构成一个完整的“大象”。



        基于上面的分析,我们可以看到,生命体的统一性源于基因组,但生命体的多样性、复杂性、功能性和所看到的表型,无疑源于蛋白质组。



        人的蛋白质组到底有多大?人类蛋白质的数量远远大于人类基因的数量,差不多有三个数量级的差别。基因组已经很复杂了,但是蛋白质组比它要复杂得多。而正是因为蛋白质组的复杂和庞大,它才能够成为生命体多样性的功能和表型的物质基础。



        蛋白质有这么多的特性,要形成对这么复杂而又庞大的一个冰山的全面了解,而不仅仅是了解冰山一角,原有的技术是做不到的,也不是未来任何单一先进技术所能够做到的。因此,启动“人类蛋白质组计划”势在必行。



        “人类蛋白质组计划”的主要科学目标是注释人类基因组,全面揭示人体蛋白质组组成及其功能,系统分析疾病发生发展过程中蛋白质组的变化规律,建立人体生理学、病理学的蛋白质组基础。



        “人类基因组计划”是按照染色体来分步实施的,“人类蛋白质组计划”则是按照不同的组织器官来实施。目前,针对不同的组织器官已经启动了不同的蛋白质组分计划,包括由美国牵头的人类血浆蛋白质组计划和中国牵头的人类肝脏蛋白质组计划,德国牵头的人类脑蛋白质组计划,加拿大牵头的动物模型蛋白质组计划,瑞典牵头的人类抗体计划等。



        如果说,“人类基因组计划”是一个“登月计划”的话,那么,“人类蛋白质组计划”就是一个“返地计划”。我们登月不容易,但是返回来更不容易。



基因组向蛋白质组“求救”



        基因组是人类遗传信息的载体,从一个完整的基因组出发,发展成为一个完整的个体。在整个人体的发育和生长中,基因组是不变的,改变的是蛋白质组。这是从时间上的变化来说的。对一个已经发育成熟的个体,从空间上看,由各种组织器官所构成,这些组织器官所对应的基因组是一样的,只是蛋白质组不同。也正是由于蛋白质组的可变性和动态性,才决定了生命过程的演化,才使得一个非常简单的受精卵演变出数量多达1012的细胞,从而构成了人体。因此,要揭示人体的变化规律,实际上很难从基因组上来回答,因为它的基因组是不变的。



        从进化上我们也发现了很有意思的现象。举例来说,人类美丽的化身蒙娜丽莎和一只大白鼠的差别显而易见,这个差别应该说是非常巨大的。原来人们预期,如果一切由基因组所决定的话,那么这两者在基因组上应该会有很大的差异和变化。但大白鼠的基因组和人的基因组相比,实际上在量上仅有5%的差别,在序列上更是只有1%的差别。

那么,这5%和1%的基因组差别,何以导致在表型和功能上呈现这么大的差别呢?



        在这种情况下,我们可以用成语“失之毫厘,差之千里”来解释。这当中必然有一个放大。这个放大的东西是什么呢?现在,人们越来越多地认识到,生物体蛋白质的差别将可能是基因水平上差别的两到三个数量级,也就是百倍和千倍的差别。也正是这样一种放大的效应,构成了表型复杂性的物质基础,使得物种之间呈现这么大的差别。



        基因是编码RNA和蛋白质的,但是从遗传信息来讲,它编码的是一级序列。就是说,基因的这个序列,通过转录和翻译过程之后,变成了一个线状的蛋白质序列,遗传信息的编码作用到此就已经结束。换句话说,它经过转录和翻译过程后,蛋白质的一级序列已经确定。在这种情况下,基因的使命已经完成。形成的线状蛋白质可以通过空间上的移位以及与其他分子拼接,形成一个更复杂的三维结构。通过这种构象的变化,就会阐释一种不同的功能。



        举个例子,疯牛病或者帕金森病,主要是因为某些蛋白质的构象发生变化所导致的,而它的一级序列并不发生改变。另外,蛋白质通过一些化学分子的修饰,产生不同的构象,发挥不同的功能。即使是同一个蛋白质,它作用的对象不一样,也可以使它产生不一样的作用。因此,当一个基因编码生成一个蛋白质后,蛋白质通过空间构象和各种修饰等,就变成了多种具有不同功能的蛋白质。通过这种改变,也使得生命的功能及其表现形式呈现出许多变化。这也是简单地回答了为什么不同物种、不同个体在基因组上变化很小,但是在生命现象和表型上却有这么大的差别。



■科学随想



解读“人之书”



尹传红



  我们已经进入到解读“人之书”的一个新时代。这个时代最基本、最突出的特点就是:人类已开始从分子水平理解自身。



  整整20年前,DNA双螺旋结构的发现者之一詹姆斯·沃森有言:……当最终被破译的时候,这些由我们的DNA分子所编码的基因信息,将提供我们人类存在化学基础的最终答案。它们不仅将帮助我们理解健康的人类生命是如何运作的,而且会解释在化学水平上,遗传因子在一些毁灭了千百万人生命的疾病中所起的作用,例如癌症、阿尔茨海默病及精神分裂症,等等。



  现在回过头来看,包括沃森在内的业界聪慧之人,对“人类基因组计划”的预期与效用,似乎都过于乐观了。沃森在其新近出版的一部著作中更是感叹:“人类基因组计划”最令我们感到谦卑的地方,在于我们发现自己对绝大多数人类基因的功能所知甚少。即使已经解开整个人类基因组,执行遗传指令的程序与线索依然是一个巨大的谜。



  不过,“人类基因组计划”已经证明,达尔文的进化论比他自己敢于想象的还要正确。所有的生物都因为有着共同的传承而互有关系,这也正是分子相似性的来源。再者,一个成功的进化上的“发明”(在自然选择上有利的一个或一组突变),是会代代相传的。随着生命树的逐渐多样化(原有谱系分开,产生新谱系,例如爬虫现在仍继续存在,但也衍生出鸟类和哺乳类的谱系),进化的“发明”最终可能出现在大量的后代物种上。



  贺福初院士在本版文章中也提到一个很有意思的现象:大白鼠的基因组和人的基因组相比,实际上在量上仅有5%的差别,在序列上更是只有1%的差别。这表型和功能上所呈现出来的巨大反差,真是耐人寻味。相关研究已陆续揭示出一些更深层次的新问题,也许还有其他目前我们尚未发现的现象或机制?与之连带的一个问题是:为什么施行“人类基因组计划”还不足以“解密天书”呢?



  简单地说,遗传信息并不直接参与生命活动,而是通过控制蛋白质的形成间接地指导有机体的新陈代谢。也就是说,一个基因所含遗传信息,通过一系列复杂的反应,最终导致了相应的蛋白质形成,蛋白质再参与到生命的各种活动中去。所以,要想真正揭开遗传的奥秘,仅仅了解基因组的碱基排列顺序是很不够的,我们还必须系统认识基因组的产物——蛋白质组。



  这就不难理解,人类蛋白质组研究继“人类基因组计划”之后,已成为生命科学乃至自然科学领域重大的科学命题,并正逐渐成为生物技术乃至整个高技术领域活跃的创新源泉。它同时也打开了通向新型医学的大门。当然,人们更为关切的是,它将给人类带来何等重大的利益,以及与之相关的重要的伦理学及法律问题。



  不妨与一个多世纪以前出现的医学微生物学的发展进程作个比较:发现细菌之后几十年,人类造出了疫苗和抗生素。与此相似,发现基因之后,我们可能也需要几十年乃至一个世纪去研究与之相关的遗传学问题,并学习怎样有效地预防和治疗遗传性疾病,真正揭示人类生老病死的机制,进而回答与人性有关的最基本的哲学问题。



感谢贺福初院士和北京市科协“首都科学讲堂”的支持
作者: 2010-7-4
医学百科App—中西医基础知识学习工具
  • 相关内容
  • 近期更新
  • 热文榜
  • 医学百科App—健康测试工具