Literature
首页合作平台医学论文基础医学论文细胞及分子生物学

人类基因组计划的现状

来源:国外医学计划生育分册
摘要:摘要人类基因组计划(humangenomeproject,HGP)旨在阐明人类基因组的结构、组成、全部3×109核苷酸的序列以及基因在染色体上的定位及其功能,从而破译人类全部遗传信息。美国于1990年正式启动HGP,估计到2003年完成人类基因组全部序列的研究。本文就HGP以及由HGP延伸而来的后基因组计划(post-genomeproject)的发展......

点击显示 收起

  摘要 人类基因组计划(human genome project,HGP)旨在阐明人类基因组的结构、组成、全部3×109核苷酸的序列以及基因在染色体上的定位及其功能,从而破译人类全部遗传信息。美国于1990年正式启动HGP,估计到2003年完成人类基因组全部序列的研究。目前,HGP已成为全球范围的合作项目。本文就HGP以及由HGP延伸而来的后基因组计划(post-genome project)的发展现状作一综述。

  关键词:人类基因组 基因克隆 基因组学 结构基因组 功能基因组

  人类基因组计划(human genome project,HGP)是由美国科学家、诺贝尔奖获得者Renato dulbecco于1986年在杂志《Science》上发表的文章中率先提出的,旨在阐明人类基因组脱氧核糖核酸(DNA)3×109核苷酸的序列,阐明所有人类基因并确定其在染色体的位置,从而破译人类全部遗传信息。美国于1990年正式启动人类基因组计划,估计到2003年完成人类基因组全部序列测定。欧共体、日本、加拿大、巴西、印度、中国也相继提出了各自的基因组研究计划[1]。由于各国政府和科学家的共同努力,HGP目前已在为全球范围的合作项目;随着数理化、信息、材料等学科的渗透和工业化管理模式的引进,HGP已真正成为生命科学领域的科学工程,基因组(genomics)作为一门新兴学科也应运而生。

  与此同时,科学界也在思索人类基因组计划完成后的下一步工作,因此就有了“后基因组计划”(post-genome project)的提法。大多数科学家认为原定于2003年所完成的人类基因组计划只是一个以测序为主的结构基因组学(structural genomics)研究,而所谓的“后基因组计划”应该是对基因功能的研究,即所谓的功能基因组学(functional genomics)。此外,一些新的概念如:“蛋白质组(proteome)”、“环境基因组学(environmental genomics)”和“肿瘤基因组解剖学计划(cancer genome anatomy project,CGAP)”等等也在不断向外延伸。

  一、结构基因组学

  (一)人类基因组作图

  人类基因组作图根据使用的标记和手段不同,初期的作图有二种:一是通过计算连锁的遗传标记之间重组频率而确定它们相对距离的遗传连锁图,一般用厘摩(cM)来表示;二是确定各遗传标记之间物理距离的物理图,一般用碱基(bp)或千碱基(kb)或兆碱基(Mb)来表示。1cM的遗传距离大致上相当于1Mb的物理距离。随着研究工作的进展,遗传图和物理图逐渐发生整合,在此基础上大量引入基因标记,从而形成了新一代的转录图[1]。

  1.遗传连锁图 遗传连锁图(genetic map)绘制需要遗传标记,早期的遗传标记主要为生化标记,20世纪80年代中期以限制性片段长度多态性(RFLP)、串联重复序列拷贝多态性和小卫星重复顺序等遗传标记为主,这类标记的数量较少,信息也较低;20世纪80年代后期发展的短串联重复序列(short tandem repeat,STR)也称微卫星(microsatellite,MS)标记,主要为二核苷酸重复序列,如:(CA)n,它们在染色体上分布较均匀,信息含量明显高于RFLP,因而成为遗传连锁分析极为有用的标记;近年来,单个碱基的多态性(single nucleotide polymorphism,SNP)标记又被大量使用,其意义已超出了遗传作图的范围,而成为研究基因组多样性和识别、定位疾病相关基因的一种新标记。

  2.物理图 物理图(physical map)包含了两层意义,一是获得分布于整个基因组的30000个序列标签位点(sequence tagged site,STS),这可使基因组每隔100kb距离就有一个标记;二是在此基础上构建覆盖每条染色体的大片段DNA克隆,如:酵母人工染色体(yeast artificial chromosome,YAC)或细菌人工染色体(bacterial artificial chromosome,BAC)、人工附加染色体(human artificial episomal chromosome,HAEC)和人工噬菌体染色体(P1 bacteriophage artificial chromosome,PAC)等连续克隆。这些图谱的制作进一步定位其它基因座提供了详细的框架[2]。

  3.转录图 构建转录图的前提条件是获得大量基因转录本即信使核糖核酸(mRNA)的序列,人类基因组中的基因数目约在10万左右,构建转录图首先需要获得人类基因的表达序列标签(expressed sequence tag,EST),以此建立一张人类的转录图,并与遗传图的交叉参照。

  4.DNA序列的生物信息学 HGP一开始就与信息高速公路和数据库技术形成了同步发展。迄今,国际上四个大的生物信息中心即美国的国家生物技术信息中心(NCBI)、基因组序列数据库(GSDB)、欧洲分子生物实验室(EMBL)和日本DNA数据库(DDBJ)已经建立和维持了源自数百种生物的互补DNA(cDNA)和基因组DNA序列的大型数据库。这些中心和全球的基因组研究实验室通过网点、电子邮件或者直接与服务器和数据库联系而获得的搜寻系统,使得研究者可以在多种不同的分析系统中对序列数据库提出质询,这些分析包括基因的发现、蛋白质模体的鉴别、调控元件的分析、重复序列的鉴别、相似性的分析、核苷酸组成的分析以及物种间的比较等。

  (二)基因组的基本结构和进化

  人类基因组研究的目的,不仅为了单纯地积累数据,而且要提示数据中所蕴藏的内在规律[3],从而更好地认识生命体。近年来,随着模式生物体测序的相继完成和人类基因组测序速度的加快(到1999年12月已宣布完成人类第22号染色体的完全测序),特别是生物信息所提供的强有力的分析和综合手段,使人人能够逐渐透过浩瀚的基因组序列信息,去探索一些更为本质的问题,如:基因组的复杂度与生物进化、基因组编码序列的结构、基因和蛋白家族、基因家族的大小及其进化。

  (三)疾病的基因组学

  HGP的直接始动因素是要解决包括肿瘤在内的人类疾病的分子遗传学问题[4],因此与人类健康密切相关。另一方面,8000多种单基因遗传病和多种大面积危害人群健康的多基因疾病(如:肿瘤、心血管病、代谢性疾病、神经疾病、精神疾病、免疫性疾病)的致病基因和疾病相关基因占人类基因组中相当大的一部分。因此,疾病基因的定位、克隆和鉴定是HGP的核心部分。

作者: 左伋 2004-9-27
医学百科App—中西医基础知识学习工具
  • 相关内容
  • 近期更新
  • 热文榜
  • 医学百科App—健康测试工具