Literature
Home行业资讯临床快报遗传与基因组

树上的熊猫和每个人的基因组

来源:三联生活周刊
摘要:12月13日出版的《自然》杂志,刊登了以深圳华大基因研究院为首,中国科学院昆明动物研究所等单位共同组成的研究小组应用新一代测序技术对大熊猫晶晶基因组的测序结果。这一技术突破带来的未来基因组研究的无尽可能,将带来每个人都可能以可承受的价格拥有自己的基因组图谱的时代。“一个新的时代到来了”一棵盘根错节、枝......

点击显示 收起

12月13日出版的《自然》杂志,刊登了以深圳华大基因研究院为首,中国科学院昆明动物研究所等单位共同组成的研究小组应用新一代测序技术对大熊猫晶晶基因组的测序结果。这一技术突破带来的未来基因组研究的无尽可能,将带来每个人都可能以可承受的价格拥有自己的基因组图谱的时代。



“一个新的时代到来了”



一棵盘根错节、枝繁叶茂的大树上,踞坐着一只憨态可掬的熊猫。那是因为当过奥运会吉祥物而名扬天下的熊猫晶晶。



王俊双臂抱胸,眯着眼上下打量了片刻这幅贴在他办公室外墙上、每天上班都会经过的喷绘壁纸,突然跃起,转身,呼喝一声,摆出个《功夫熊猫》中的招牌起手式。



“怎么样,我这个局开得还不错吧?”



这一刻,很难将这个神采飞扬、留着军训头、看起来仿如青涩“大一”新生的年轻人,与深圳华大基因研究院副院长、“生命之树”计划负责人、办公室小姑娘带着一副崇拜表情口口声声叫着的“领导”联系起来。



即便真是得意忘形,王俊确有开心的理由。2009年12月13日出版的《自然》杂志,刊登了以深圳华大基因研究院为首,中国科学院昆明动物研究所、中国科学院动物研究所、成都大熊猫繁育研究基地和中国保护大熊猫研究中心共同组成的研究小组应用新一代基因测序技术对大熊猫晶晶基因组的测序结果。这是人类第一次全面掌握大熊猫这一物种的基因资源。虽然在论文的120多名作者中,王俊把自己的名字排到了最后,但谁都知道,身为通信作者的他,才是这项研究背后的关键人物。



外行看热闹。在这篇长达7页的论文中,的确不乏吸引公众眼球的新奇刺激点。如果不是基因泄密,有谁会知道,坚持“可以食无肉,不可居无竹”的世外高人般的生活作风,为了适应每天14个多小时剥竹为食的生活,可以由手腕上的桡籽骨进化出一根灵活的“伪拇指”的熊猫,竟然体内没有一个与消化竹子纤维有关的基因,天生是个彻头彻尾的肉食动物?又有谁能想到,一直被怀疑走到进化尽头、因为种群数量稀少而很可能出现严重近亲繁殖现象的活化石,从基因组的杂合率来看,遗传多态性甚至比人还要高(常染色体的杂合率是人类的1.95倍),也即是说,假如可以维持自然的繁殖交配,13亿中国人发生兄妹恋的危险性倒还比仅有的1500多只大熊猫高?想必,你更不会了解,在迄今为止已经完成全基因组测序的物种中,大熊猫居然与狗在遗传上最为接近。



但是,对于从事基因研究的内行来说,这篇论文最大的价值,却隐藏在前4页看起来冗长枯燥的技术细节讨论之中。



“知道熊猫隐藏在素食主义者外表下本性爱腥膻的一面固然不错,不过更值得关注的,却是得到这一结果的方法。”隶属《连线》杂志的著名技术博客Ars  Technica的科学编辑约翰·蒂姆(John  Timmer)如是表示。



事实上,真正令王俊和他的团队欣喜若狂,也令向来大牌的《自然》少有地连续在两期杂志上予以评论关注的,是首次应用新一代测序平台和短序列组装(de  novo  assembly)成功完成复杂的大型哺乳动物基因组这一技术突破所带来的未来基因组研究的无尽可能。



“以前人们一直觉得,这一代的测序技术与传统的桑格双脱氧链终止法(Sanger  method)相比,测得短,不可能组装成这么大的基因组。现在我们第一个做出来,大家一下子都被震动了。”王俊对本刊记者说,“一个新的时代到来了。”  



这个时代,是王俊雄心勃勃囊括各类具有科研意义和经济价值的动植物的全面基因组测序的“生命之树”计划的时代,更是每个人都可能以可承受的价格拥有自己的基因组图谱的时代。



书山有路“撕”为径



如果你已经被“短序列组装”、“桑格法”、“测序平台”这些佶屈聱牙的专业术语弄得头昏眼花,不妨赶快站到一排书架前——当然,不是叫你恶补莫须有的《分子生物学》或《基因组学》。



想象一下,这个书架上,正好有21本与熊猫有关的系列丛书,而你被分配了这样一个任务,必须把这21本书全部看完,然后再完整地抄写一遍。



想自己一个人搞定?如果你没把握长生不老,最好还是别存有这样的幻想。这21本书,最薄的一本也有几百万页,加在一起嘛,字数不算多,也就不到24个亿。



你猜得没错。这21本庞然大书,便是大熊猫的21对染色体。所谓的基因组,就是这21本书中包含的近24亿个字符。这些字符只有4种,在生物学上,它们的名字分别叫做腺嘌呤(adenine,缩写为A)、鸟嘌呤(guanine,缩写为G)、胞嘧啶(cytosine,缩写为C)、胸腺嘧啶(thymine,缩写为T)。



人类其实是对书架上与人有关的那些书最感兴趣的,虽然它比熊猫系列丛书还要多出整整两大本。但在相当长的一段时间里,由于工作量浩大,无论是通读抄写哪一个,都被认为是不可完成的使命。最多,是有针对性地从里面挑上一两本,翻到最想看的那一页看两眼。或者干脆另拣本力所能及的薄薄小册子,比如《草履虫概要》。



这当然很不过瘾。终于,在1975年,一个叫弗雷德里克·桑格(Frederick  Sanger)的英国人,想出了一个好办法。



桑格先用一个聚合酶连锁反应来实现特定DNA片段的扩增,然后在这一过程中随机加入双脱氧核糖核酸,从而获得不同长度的DNA片段,随之经由电泳对其进行分析测序。运用这一方法,桑格成功测定了一种噬菌体的基因组序列,并因此种方法获得1980年的诺贝尔化学奖。继续套用书的比喻,那就是桑格给研究基因的科学家都开了窍:原来,书不一定要一页一页按部就班地读,也可以撕开来,几百几千几万人分头细看,分头抄写,效率更高,大不了最后再粘起来就是了。这便是直到最近依然是大型基因组测序金标准的桑格双脱氧链终止法。人类基因组计划正是借助这一方法而完成测序工作的。



第一个人类基因组的测序工作用了将近10年的时间才宣告完成,前后投资超过20亿美元。然而,当它快要结束时,技术上的进步已经显著缩短了测序所必需的时间,成本也直线下降。而此时,层出不穷的第二代基因组测序技术,也开始向桑格法发起挑战。



454生物科学公司(454  Life  Sciences)是第一个向桑格法竖起反旗的挑战者。这家位于美国康涅狄格州的生物技术公司发明了一种读取速度显著高于桑格法的DNA测序方法,10个小时就可以完成对4亿个碱基对的高质量测序。2007年5月,这家公司完成了对“DNA之父”詹姆斯·沃森的基因组测序,并成功地将测序成本压低到了100万美元之下。



紧随454生物科学公司,总部设在加州圣地亚哥的Illumina也推出了自己的新一代基因组测序技术。与454生物科学相比,Illumina的宣传口号是“测得更快,成本更低”。就在2009年6月份,这家公司推出了“每个人的基因组”项目,只要花上4.8万美元,你就可以拿到你自己的全基因组——虽然目前必须通过医疗机构才有资格申请这项服务。这一次华大基因研究院的大熊猫基因组测序工作,便是在Illumina基因组分析仪(Genome  Analyser)这一平台上完成的。



他们是如何做到这一点的呢?



“很简单。把书撕得更碎一些呗。”负责此次大熊猫基因组测序平台搭建的基因组技术中心的田埂微笑着告诉本刊记者。



“传统的测序方法,一次只能测一段DNA,这一段上可能有500~1000个碱基,但到了新一代的测序平台上,通过用高压氮气物理振荡的方式,可以把染色体打成只有45~75个碱基的小段,然后几千几百段平行地同时在读。这样,一次获取的信息量就可能是以前的几百倍到几千倍。”



微微的嗡鸣声中,田埂指点华大测序中心实验室里一字排开的测序仪。20台机器,24小时不停运转,自2008年3月启动,到2008年底,熊猫基因组中24亿个碱基基本读出,放到以往,这是不可思议的速度。



然而,这还不算完。



“拼”图索骥



把书撕掉,分头抄写,就算一字一句都抄得准确无误,工作也才做了一半。集齐了8部《四十二章经》中的羊皮碎片,也得有双儿的水磨功夫,才能拼得出鹿鼎山下的藏宝图。在熊猫基因组测序项目中,毕业于南开大学的樊伟所扮演的,正是双儿的角色,而他的独门武功,便是前面提及的“短序列组装”(de  novo  assembly)。



以前的桑格法,测的DNA片段长,最终需要拼起来的也就少。换成新的测序法,需要拼接的是“短的DNA序列”,工作量顿时级数增长。譬如拼图,1000块的难度,绝对不止100块的10倍。



况且,染色体中,本有许多重复的DNA序列。“根据我们最后计算的结果,大约有36%的序列是重复的。”樊伟告诉本刊记者。这就像不同的书中,“今天你吃饭了没有?”一句话可能出现过几百次,如何判断它到底是第1页上的,还是第1111页上的?



以往的方法,是换人,反复读。“比如桑格法测序,金标准要求一个碱基被覆盖8次,好比撕烂了的一页书,8个不同的人分别拼起来读,最后都在同一个位置读到了‘今天你吃饭了没有’这段话,才能够认定它的确应该放在这里。”樊伟介绍道。而转移到Illumina的平台上,同样是第一轮组装,可能就要覆盖56次才可以。



这不仅意味着庞大的计算量,还对拼装程序算法和语法的要求特别高,开始的时候,必须不断调试,而且要拿拼出来的书与范本不断校验。这个范本,是在熊猫基因组测序刚刚开始之时,由位于北京的华大基因研究院以传统桑格法测出的一部分熊猫基因组。



说起拼图,基因组框架图、基因组精细图和基因组完成图的说法,常常令人迷糊。在樊伟看来,答案其实也简单,就是他这个双儿,到底把水磨功夫做到哪一种程度。



“拿熊猫来说,它有21条染色体,如果把这些染色体打碎后重新拼起来,最后再原样拼成21条染色体,那就是最理想的状态,也即所谓的完成图。但这事实上是不可能的。”樊伟说。



在实践中,即使读的次数再多,也总会有一部分碱基是无论如何读不出来的,对于这些神秘的不肯揭开面纱的碱基,科学家们通常将其称为“上帝基因”。



比完成图次一级的,是所谓精细图,再次,是框架图。“比如21本书,刚开始把它撕碎的时候,可能有几千万个碎片,我们大致读几遍之后,可以把这些碎片归归类,补缀成大约一万段。在这一万段中,我可以告诉你,每一页都有哪些字,但每个字具体都在什么位置,却还不清楚。这个阶段的基因组图谱,被称为框架图。”



在框架图的基础上,樊伟继续搭制他的“脚手架”(scaffold)——参照传统测序结果得出的可以确定某些位置碱基排列顺序的DNA片段,然后再把一次一次从不同位点开始但包含有相同碱基的重叠群(contig)还原到脚手架上去。最后得到的,是1000多段连缀在一起的长序列,也即是这次得出的大熊猫基因组的精细图。它覆盖了熊猫全基因组的94%,只余下不到0.05兆的空缺有待填补。而根据这94%的基因组信息,在不到一个月的时间里,熊猫研究者已经得出了一系列令人耳目一新的研究结果。



比如,熊猫为什么不吃肉?



晶晶的秘密



熊猫是半路出家的素食主义者吗?



“就目前的结果看,答案几乎是肯定的。”王俊告诉本刊记者。



对熊猫体内所有可能与食物选择和消化相关的基因的研究分析显示,熊猫拥有一个典型的肉食动物用来合成蛋白酶、淀粉酶、脂肪酶、纤维素酶、乳糖酶、麦芽糖酶和转化酶等一系列消化酶的所有基因。有趣的是,虽然熊猫整日以竹子为食,研究人员反复寻找,却没有能够找到与消化竹纤维相关的基因。“我们只能据此推断,竹子纤维素的消化功能主要取决于大熊猫的胃肠道菌群。”



虽然听起来匪夷所思,但在奇妙的动物世界,这也并非绝无仅有。“比如白蚁,也是这样。”田埂告诉本刊记者,“在南方,经常有白蚁肆虐,整栋房屋的木头都可能被它蛀空。但事实上,白蚁是无法消化木质素的。它必须依赖一种与其共生的微生物,才能将木质素转化为消化道可以吸收的糖类。所以杀白蚁最好的办法,是杀死与它共生的微生物。”  



进一步比对熊猫基因组与其他肉食动物基因组的差异,研究人员又发现了另一个奇妙之处。众所周知,甜、咸、酸、苦、鲜是5种基本味觉。但熊猫的味觉感受器基因与狗的相比,虽然在苦味的感觉上似乎略胜一筹,但负责感受鲜味的T1R1基因,却因为发生移码突变而变成了“假基因”。此前的研究表明,T1R1基因和T1R3基因是决定一种动物能否感受到鲜味的关键基因。这一基因的缺失,使得熊猫即使不闻韶乐,也不知肉味。



这并不意味着熊猫真的绝不沾荤。“在野外,熊猫也会偶尔吃一点肉。但这很可能是出于快速补充蛋白质和脂肪的需要,并不是出于尝鲜的目的。就像人生病了会愿意喝苦药水,但让他天天拿药当饭吃,基本没戏。”田埂表示。至于这种变化是熊猫的主动进化还是环境变化后的被动适应,则还需要进一步的证据支持。



如果说吃肉还是吃竹子的习性不过是满足人们好奇之心的追溯性研究,从建设性的角度看,已完成的熊猫基因组精细图回答的最重要的问题,是熊猫是否还能够在地球上生存下去。说来也巧,在走廊中就此向王俊提问时,他忽然眼睛一亮,伸手指向沙发上端坐的一人:“哎呀,我是玩票的,他才是真正的熊猫专家啊。”



接连发表基因组测序重要结果的深圳华大基因研究院,虽然僻处颇有些鸟不生蛋味道的深圳市郊,工业感十足,甚至带有浓厚斯巴达式气息的办公楼里,俨然聚集了一个学术小联合国。每一层楼简陋的会客厅里都仿佛总是挤满了来自五湖四海的研究者。直到顺着王俊的指向望去,一张似曾相识的带着招牌式憨厚笑容的脸,这才惊呼:怎么你也在这里?



然后顿悟——想必,和本刊记者一样,也是为了新公布的这份大熊猫基因组。



这张笑脸属于王大军。最早与北京大学大熊猫保护研究中心的他相识,还是在2004年,踏访秦岭大熊猫自然保护区的路上。素不相识的我们约定在洋县见面,从唐家河自然保护区结束现场调查北上返京的他,载了刚刚穿越老县城、太白山、长青3个保护区的灰头土脸的我,一同赶到中国自然保护区中熊猫分布密度最高的佛坪保护区,与秦岭大熊猫研究中心主任雍严格见面。我对熊猫栖息地破碎化的大部分知识源自与他的车上对谈。正是他让我知道,即使投入数目庞大的保护基金、设立再多的自然保护区,如果不从根本上解决熊猫自然栖息地为人类活动所分割阻断的现象,大熊猫的种群交换将无法进行,近亲繁殖不可避免。



5年之后,居然又在深圳见面。话题重新回到熊猫的命运。这惹人怜爱的具有象征意义的动物,是否像2009年9月BBC自然节目主持人克里斯·帕克海姆(Chris  Packham)质疑的那样,已经走上了灭绝的不归路,所有的一切努力,不过是在“保护一个生物进化的失败物种”?



王大军的表情亦喜亦忧。



“事实上,如果单纯从熊猫晶晶这个个体的基因组来看,虽然它有着父母分别来自岷山山系和凉山山系的特殊背景,但结果与吕植在上世纪90年代做过的熊猫基因多样性调查是一致的,也就是说,目前看还没有近亲繁殖的危险。但是,如果从另一角度看,保持了比较高的遗传多态性,种群数目却只有1590多只,那么也说明了,熊猫的种群数目骤减是发生在比较晚近的时候,而且是很突然降到这么少的。这又意味着熊猫的栖息地的确在受到严重的破坏,保护非常有必要,而栖息地被分割会增加近亲繁殖的可能。”王大军说。而他之所以来到深圳华大基因研究院,正是希望可以通过新的基因手段,为野外栖息地的管理和保护找到答案。



“那么,得到保护的,可能不仅仅是熊猫,还有川藏高原上的藏羚羊、雪豹和棕熊等众多濒危物种。”



从生命之树到1万美元的基因组



站在王俊的角度,选择熊猫晶晶作为启动华大充满野心的“生命之树”计划的动物,除了熊猫“可爱、好玩,是中国国宝”、基因组足够大可以证明第二代测序组装技术的可行性、没有竞争对手这些因素,吸引眼球是另一个重要的原因。很显然,生命之树上的其他物种:家鸡、牡蛎、西瓜、油菜、木薯、甘蔗、人参……看上去都不如肉乎乎的熊猫晶晶更能给人好感。



在与上面提到的BBC主持人克里斯·帕克海姆关于是否应该保护熊猫的论战中,世界自然基金会的首席科学家达克·怀特(Dark  Wright)举了一个有趣的例子:“正是因为咱们俩讨论的是熊猫,才有人会看完这篇老长的文章。换成热带雨林里的青蛙?没错,问题的性质是一样的,但我估计关心的人恐怕要少得多了吧。你喜欢这样吗?”



这倒也无可厚非。澳大利亚的遗传学家,也是优先于2008年完成了惹人喜爱但其实本身科学意义不大的塔玛莎袋鼠的全基因组测序工作。与此类似的,还有以红酒著称的法国和意大利2007年联合完成的黑皮诺葡萄基因组测序。熊猫的明星效应可以为“生命之树”项目争取到外界更多的关注,自然,也伴随着最重要的研究基金。



在华大,“测序就是一切”(Sequencing  is  Everything)几乎成了研究人员的口头禅。但这家迅速扩张的以基因技术起家的科研机构,野心显然不止于此。这里流传着身为华大掌门人的杨焕明的名言:“我们不要做卖电脑的惠普,而要做卖服务的甲骨文。”而从王俊到樊伟,大家的共识是,一份完成的基因组测序图谱,无论是熊猫的、人的还是水稻的,就像一台全新出厂的计算机。你能用它做什么,完全要看使用者的自身水平,以及市场上有什么样的软件。



直到目前为止,这台计算机还是只有极少数人才能享用的奢侈品,而且,绝大多数人也还没搞清楚,到底能用它做什么。这就好比电脑如果还像30年前那样,只能用来玩简陋的Ping  Pong游戏,慢悠悠地收发纯文本邮件,肯定不会像现在这样让人觉得不可一日或缺。但这种情形显然很快就会变成历史。



早在2009年7月,鲑鱼基因组测序项目的第一阶段任务完成时,就已经有人预测,这可能是最后一个使用又慢又贵的桑格法进行基因组测序的物种了。使用Illumina测序平台、短序列组装技术成功完成的大熊猫基因组,更是证明了新一代高速廉价的测序手段亦足以应付堪与人类相比的复杂基因组。况且,比霰弹枪式测序更先进一步的单分子测序技术,也已日趋成熟。王俊乐观地预测,在一两年间,个人基因组测序的费用就可以降到1万美元以下,那时,他将不排除自己亲身一试的可能。而Illumina首席执行官杰伊·福莱特雷(Jay  Flatley)则公开表示,到2019年,基因组测序将成为每一个新生儿的常规体检项目。



到那时候,华大基因会为我们每一个人带来什么?



田埂没有回答,带我楼上楼下参观了一圈华大的基因体检中心和农业部重点实验室。前者目前已经可以用基因检测的手段准确进行HPV和唐氏综合征的筛查,而后者,一个计划中的项目,是将在老挝亩产可超万斤的木薯通过基因改造的方式,转化为更容易为人类利用的粮食或能源。



我们止步于一块有钱学森头像的招贴板。左上方贴着钱老那篇争议众多的“亩产万斤”文章,右手边,则是因为在华大的工作已经在《自然》和《科学》上发表多篇文章的5名大学生和高中生的照片。最引人注目的是左下角一张A4纸上打印的两句话:



“没有做不到的,只有想不到的。”
作者: 2010-1-15
医学百科App—中西医基础知识学习工具
  • 相关内容
  • 近期更新
  • 热文榜
  • 医学百科App—健康测试工具