Literature
Home行业资讯临床快报遗传与基因组

cDNA文库构建策略及其分析研究进展

来源:云南农业大学学报
摘要:自20世纪70年代中期首例cDNA克隆问世以来,构建cDNA文库已成为研究功能基因组学的基本手段之一。cDNA便于克隆和大量表达,它不像基因组含有内含子而难于表达,因此可以从cDNA文库中筛选到所需的目的基因,并直接用于该目的基因的表达。通过构建cDNA表达文库不仅可保护濒危珍惜生物资源,而且可以提供构建分子标记连锁图谱......

点击显示 收起

  自20世纪70年代中期首例  cDNA  克隆问世以来,构建  cDNA  文库已成为研究功能基因组学的基本手段之一。cDNA  便于克隆和大量表达,它不像基因组含有内含子而难于表达,因此可以从  cDNA  文库中筛选到所需的目的基因,并直接用于该目的基因的表达。通过构建  cDNA  表达文库不仅可保护濒危珍惜生物资源,而且可以提供构建分子标记连锁图谱的所用探针,更重要的是可以用于分离全长基因进而开展基因功能研究。因此,cDNA  在研究具体某类特定细胞中基因组的表达状态及表达基因的功能鉴定方便具有特殊的优势,从而使它在个体发育、细胞分化、细胞周期调控、细胞衰老和死亡调控等生命现象的研究中具有更为广泛的应用价值,是研究工作中最常使用到的基因文库。  



  从1976年  HOFSTETTER  成功的构建了第一个  cDNA  文库以来,构建  cDNA  文库的技术方法经历了一个逐步发展完善的过程。初期  cDNA  文库,由于当时技术的限制,选用质粒载体存在着连接效率低、难以扩增和保存等缺点,而  YOUNG  和  DAVIS  重组载体为表达性文库构建和保存提供了质的飞跃。近年来,cDNA  文库构建的新方法层出不穷,但其共同目的是使  cDNA  文库更加迅速、高效满足研究的需要。本文就近年来发展的  cDNA  文库的构建及其类型特点作一简要综述。  



1  cDNA  文库的构建  



1.1  cDNA  文库构建的基本原理与方法  



  cDNA  文库是指某生物某发育时期所转录的全部  mRNA  经反转录形成的  cDNA  片段与某种载体连接而形成的克隆的集合。经典  cDNA  文库构建的基本原理是用  Oligo(dT)  作逆转录引物,或者用随机引物,给所合成的  cDNA  加上适当的连接接头,连接到适当的载体中获得文库。其基本步骤包括:RNA  的提取(例如异硫氰酸胍法,盐酸胍—有机溶剂法,热酚法等等,提取方法的选择主要根据不同的样品而定),要构建一个高质量的  cDNA  文库,获得高质量的  mRNA  是至关重要的,所以处理  mRNA  样品时必须仔细小心。由于  RNA  酶存在所有的生物中,并且能抵抗诸如煮沸这样的物理环境,因此建立一个无  RNA  酶的环境对于制备优质  RNA  很重要。在获得高质量的  mRNA  后,用反转录酶  Oligo(dT)  引导下合成  cDNA  第1链,  cDNA  第2链的合成(用  RNA  酶  H  和大肠杆菌  DNA  聚合酶  I,同时包括使用  T4  噬菌体多核苷酸酶和大肠杆菌  DNA  连接酶进行的修复反应),合成接头的加入、将双链  DNA  克隆到载体中去、分析  cDNA  插入片断,扩增  cDNA  文库、对建立的  cDNA  文库进行鉴定。这里强调的是对载体的选择,常规用的是  λ  噬菌体,这是因为  λ  DNA  两端具有由12个核苷酸的粘性末端,可用来构建柯斯质粒,这种质粒能容纳大片段的外源  DNA。  



1.2  cDNA  全长文库  



  经典  cDNA  文库的构建虽然高效、简便,但文库克隆的片段一般较小,单个克隆上的  DNA  片段太短,所能提供的基因信息很少,大多需要几个克隆才能覆盖一个完整的全基因的  cDNA。为了克隆到真正的  cDNA  全长,建立富含全长的  cDNA  文库具有重要意义。为此,必须克服仅用  mRNA  的  PolyA  尾合成以及由普通逆转录酶作用特点所导致的局限性。全长  cDNA  文库,是指从生物体内一套完整的  mRNA  分子经反转录而得到的  DNA  分子群体,是  mRNA  分子群的一个完整的拷贝。全长  cDNA  文库不仅能提供完整的  mRNA  信息,而且可以通过基因序列比对得到  mRNA  剪接信息,此外,还可以对蛋白质序列进行预测及进行体外表达和通过反向遗传学研究基因的功能等。目前所报道的对全长文库的构建一般按照美国  CLONTECH  公司的  SMART  cDNA  Library  Construction  Kit  方法或  GeneRacer  试剂盒  (Invitrogen,USA)  使用说明进行。判断一个  cDNA  文库中的  cDNA  序列是否是全长基因的  cDNA,主要方法有以下几种。  



1.2.1  直接从序列上评价  



  5'端:如果有同源全长基因的比较,可以通过与其它生物已知的对应基因5'末端进行比较来判断。如果无同源基因的新基因,则首先判断编码框架是否完整,即在开放阅读框的第1个  ATG  上游有无同框架的终止密码子;其次,判断是否有转录起始点,一般加在5'帽结构后有一段富含嘧啶的区域,或者是  cDNA  5'序列与基因组序列中经过酶切保护的部分相同,则可以确定得到的  cDNA  的5'端是完整的。3'端:同样可以用其它生物已知的对应基因3'末端进行比较来判断,或编码框架的下游有终止密码子,或有1个以上的  PolyA  加尾信号,或无明显加尾信号的则也有  PolyA  尾。  



1.2.2  用实验方法证实  



  可以通过引物延伸法确定5'端和3'端的长度,如:5'端  RACE,3'端  RACE,或者通过  Northern  Blot  证实大小是否一致。  



1.3  对  cDNA  文库的分析  



  对  cDNA  文库质量的评价主要有两个方面。第一方面为文库的代表性,cDNA  文库的代表性是指文库中包含的重组  cDNA  分子反映来源细胞中表达信息(即  mRNA  种类)的完整性,它是体现文库质量的最重要指标。文库的代表性好坏可用文库的库容量来衡量,它是指构建的原始  cDNA  文库中所包含的独立的重组子克隆数。库容量取决于来源细胞中表达出的  mRNA  种类和每种  mRNA  序列的拷贝数,1个正常细胞含10000~30000种不同的  mRNA,按丰度可分为低丰度、中丰度和高丰度三种,其中低丰度  mRNA  是指某一种在细胞总计数群中所占比例少于0.5%时。满足最低要求的  cDNA  文库的库容量可以用  Clack-Carbor  公式  N=Ln(1-P)/(1-1/n)  计算(  P  为文库中任何一种  mRNA  序列信息的概率,通常设为99%;N  为文库中以  P  概率出现细胞中任何一种  mRNA  序列理论上应具有的最少重组子克隆数;n  为细胞中最稀少的  mRNA  序列的拷贝数;T  为细胞中表达出的所有  mRNA  的总拷贝数)。第二方面是重组  cDNA  片段的序列完整性。在细胞中表达出的各种  mRNA  片段的序列完整性。在细胞中表达出的各种  mRNA  尽管具体序列不同,但基本上都是由3部分组成,即5'端非翻译区,中间的编码区和3'端非翻译区。非翻译区的序列特征对基因的表达具有重要的调控作用,编码序列则是合成基因产物—蛋白质模板。因此,要从文库中分离获得目的基因完整的序列和功能信息,要求文库中的重组  cDNA  片段足够长以便尽可能地反应出天然基因的结构。  



2  cDNA  文库构建的其它类型  



2.1  均一化  cDNA  文库  



  它是指某一特定组织或细胞的所有表达基因均包含其中,且在  cDNA  文库中表达基因对应的  cDNA  的拷贝数相等或接近。WEISSMAN  早就提出了可以通过基因组  DNA  饱和杂交的原理将  cDNA  文库进行均一化的理论。但该理论一直以来都被认为不能应用于实际。其主要限制因素是难以提供足量的极低表达丰度的  cDNA  用于饱和杂交,从而可能会造成部分基因的  cDNA  的丢失。20年前,基于  DNA-RNA  杂交的研究就已经将基因的转录水平分为高中低3类。随后研究进一步表明,绝大多数基因是处于中等或低等表达丰度的,在单个细胞中含有近1~15个拷贝,而高丰度表达基因的转录产物在单个细胞中最高可达5000个左右拷贝,约占总表达量的25%。这种基因表达能力上的巨大差异成了获得一个具有完整代表性的  cDNA  文库的障碍,其表达量上的巨大差异更为大规模研究增添了困难。对单一组织的  cDNA  文库而言,高拷贝基因序列的大量存在给基因的筛选和鉴定带来不必要的浪费,尤其是在大规模的  EST  测序中。  



  均一化  cDNA  文库是克服基因转录水平上巨大差异给文库筛选和分析带来障碍的有效措施,有利于研究基因的表达和序列分析。现在,在构建均一化的  cDNA  文库中至少有2种主要的观点:一种是基于复性动力学的原理,高丰度的  cDNA  在退火条件下复性的速度快,而低丰度的  cDNA  复性要很长时间,从而可以通过控制复性时间来降低丰度;另一种是基于基因组  DNA  在拷贝数上具有相对均一化的性质,通过  cDNA  与基因组  DNA  饱和杂交而降低在文库中高拷贝存在的  cDNA  的丰度。第一种方法的掌握对技术的要求比较高,对多数人而言需要多次摸索才能找到最适条件;而后一种方法易于掌握,但有研究者根据复性动力学的原理也提出了其不利因素,即采用基因组  DNA  饱和杂交的方法会因为低拷贝的表达基因拷贝数少而无法被杂交上。目前已报到的均一化  cDNA  文库多是根据第二种原理构建的,常用策略有基于  PCR  技术利用  cDNA  多次复性  mRNA-cDNA  杂交等。有研究报道,针对各自选择的高表达靶序列进行分析后,均一化处理后文库的高丰度表达  cDNA  是处理前的0.3%~2.5%,基本满足节约筛选的要求。  



  均一化  cDNA  文库具有以下4方面的优点:第一,在经济上具有广泛的应用空间,可以节约大量试验成本。第二,增加克隆低丰度  mRNA  的机会,适用于分析各种发育阶段或各种组织的基因表达及突变检测。第三,与原始丰度的  mRNA  拷贝数相对应的  cDNA  探针与均一化的  cDNA  文库作杂交,可以估计出大多数基因的表达水平及发现一些组织特异的基因。而以往的文库构建,忽略了  mRNA  丰度的影响。第四,可以用于遗传图谱的制作和进行大规模的原位杂交,作为优化的文库系统还可以用于大规模的测序或芯片制作等研究。  



2.2  差减  cDNA  文库  (Subtractive  cDNA  library)  



  差减文库也称扣除文库,使用两种遗传背景相同或大致相同但在个别功能或特性上不同的材料(如不同基因处理细胞系或植物的近等基因系等)提取  mRNA  (或反转录后合成  cDNA),在一定条件下用大大过量不含目的基因的一方作为驱动子(  Driver  )与含有目的基因的试验方(  Tester  )进行杂交,选择性的祛除两部分共同基因杂交形成的复合物,往往进行多次的杂交—祛除过程,最后将含有相关目的基因的未杂交部分收集后,并连接到载体形成文库。消减杂交是构建差减  cDNA  文库的核心,差减文库是否构建成功很大程度上决定于差减杂交的效率。差减杂交的方法主要有(1)羟基磷灰石柱层析法  (HAP);(2)生物素标记、链亲和蛋白结合排除法;(3)限制性内切酶技术相结合的差减方法;(4)差减抑制杂交法  (SSH);(5)磁珠介导的差减法  (MAST),其中  SSH  法最为常用。  



  抑制性消减杂交技术  (Suppression  Subtractive  Hybridization,SSH)  是  DIATCHENKO  等人于1996年依据消减杂交和抑制  PCR  发展出来的一种分离差异表达基因的新方法,主要用于分离两种细胞或两种组织的细胞中的差异表达基因。它主要是利用抑制  PCR  对差减杂交后丰度一致的目的材料中两端连有不同接头的差异表达片段进行指数扩增,而两端连接上同一接头的同源双链片段仅呈线形扩增,从而达到富集差异表达基因的目的。因此应用该技术能够对两个有差异表达的材料(细胞或组织)高、中、低丰度目的基因都进行有效、快速、简便克隆。近年来已成功应用于植物发育、肿瘤与疾病、以及外界因子诱导组织细胞中相关的应答基因的分析和克隆。  



2.3  固相  cDNA  文库构建  



  cDNA  的固相合成是人们早为熟知的技术,但局限之处  oligo(dT)  与纤维素胶粒或磁珠的结合比较牢固,将  cDNA  洗脱下来时得率不是很高,而且以后的反应步骤也不能都在介质上进行,这可能是该技术应用并不十分广泛的原因。  



  最近  THOMAS  ROEDE  提出了一种新的  cDNA  文库固相合成方法(  THOMAS  ROEDE,1998),克服了以前文库构建中存在的缺点,所用的酶和试剂与传统方法完全相同,不同的是  cDNA  的合成和修饰均在固相支持物—磁珠上完成。cDNA  通过一个生物素固定在链霉素偶联的磁珠上,这样在反应过程中就可以简便而迅速的实现酶和缓冲液的更换,因此它将快速与高质量的文库构建结合在一起(构建文库只需1  d),并且构建的文库适合大多数的研究目的。  



  固相  cDNA  合成法的主要优点是可以简便  cDNA  合成的操作。在进行缓冲液更换时既没有  cDNA  的丢失之忧,也无其它物质污染之忧。另外,用此方法可以得到真实的代表性文库,它包含有短小的  cDNA,这是因为在克隆之前省去了分级分离的步骤。总之,固相法结合了传统的  cDNA  合成的优点并弥补了其不足。这种方法简便易行,可靠低廉,所建文库高质量,因此它可能会替代目前应用的  cDNA  文库操作方法。  



  另外,最近发展起来的微量  RNA  的  cDNA  构建,是使用  PCR  技术,在实验室条件下扩增的  mRNA  的  cDNA  量,其  PCR  检测的灵敏度远远大于反转录  PCR(RT-PCR)  法。微量  RNA  的  cDNA  PCR  文库的构建可为有关微量活性物质遗传基因的研究提供方便。  



3  cDNA  文库应用于分离新基因的方法  



  发现并分离克隆新基因始终是分子生物学研究的主要任务和目的,虽然  cDNA  文库的用途很多,但是,应用于分离新基因是其最重要的用途。前述的不管是哪种类型的  cDNA  文库,都可以用于分离新基因,只是使用的方法有差异。分离方法主要有两种:第一,对于非全长  cDNA  文库,即不管是经典的  cDNA  文库方法或差减法构建的  cDNA  文库,需要利用已经获得的新  cDNA  序列片段,通过  RACE  方法获得新基因的全长序列。第二,利用全长  cDNA  文库与目的基因片段作为探针的杂交筛选。  



3.1  从非全长  cDNA  文库中筛选新基因  



3.1.1  RACE  法  



  RACE  文库即快速扩增  cDNA  末端法(  Rapid  Amplification  of  cDNA  End,RACE  )只需知道  mRNA  内很短的一段序列即可扩增出其  cDNA  的5'(5'  RACE  )和3'端(3'  RACE  )。该法的主要特是利用一条根据已知序列设计的特异性引物和一条与  mRNA  的  PolyA  (3'  RACE  )或加至第一链  cDNA  3'端的同聚尾(5'  RACE  )互补的通用引物,由于同聚体并非良好的  PCR  引物,同时为了便于  RACE  产物的克隆,可向同聚体引物的5'端内加入一内切酶位点。所用的  cDNA  模板可以使用多聚  dT  引物延伸合成(3',5'-RACE  均可)。当  RACE  PCR  产物为复杂的混合物时,可取部分产物作模板,用另一条位于原引物内侧的序列作为引物与通用引物配对进行另一轮  PCR  (巢式  PCR  )。早在1988年,FROHMAN  等即用此方法成功地获得了4种  mRNA  的5'合3'末端序列。  



  迄今已有几种改良的  RACE  方法,通过修饰与优化,与最初的  FROHMAN  报道有所不同:(1)  BARSON  等采用锁定寡聚脱氧胸腺嘧啶核苷酸引物“锁定”基因特异性序列的3'末端与其  Poly  (A)  尾的连接处,进行第1条  cDNA  链的合成,消除了在合成第1条  cDNA  链时寡聚  (dT)  RNA  模板  Poly  (A)  尾任何部位结合而带来的影响。(2)  EDWARDS  和  TROUTT  小组利用  T4  RNA  连接酶把寡核苷酸连接到单链  cDNA  的5'末端,然后用一个3'末端特异性引物和一个锚定引物就可以直接对锚定连接的  cDNA  进行体外  PCR  扩增和克隆。随后,BERTLING  等又用  DNA  连接酶代替  RNA  连接酶。这些方法都避免了在第2条  cDNA  链内同聚序列区互补而导致截断  cDNA  的产生。(3)  MARUYAMA  等提出  cRACE  法,采用的引物为基因特异性的,所以非特异性  PCR  产物基本上不会产生。Clontech  等公司也根据  RACE  法的更新,相继推出了  RACE  的相应试剂盒,为克隆  cDNA  提供了方便的工具。最近  HUANG  等人即用  RACE  试剂盒克隆了一种含有类植物血凝素免疫受体  ITIM。  



3.1.2  用  PCR  法从  cDNA  文库中快速克隆基因  



  通过对文库的筛选或适用简并引物进行  PCR  反应,常常只能获得不完整的  cDNA  片段。为了得到  cDNA  全长,常常要重新筛选文库。重新筛选文库工作量大,RACE  虽然为此提供可方便,但应用该方法需重新提取  mRNA  和反转录。而用  PCR  法从  cDNA  文库中快速克隆基因的方法,只需提取  λ  噬菌体  DNA,按保守序列设计  PCR  引物便可将未知片段进行克隆。特别是在基因的两端变异较大而中间某区域保守的情况下,用  PCR  法很容易获取  cDNA  的全长。同一转录产物,又是存在着不同的拼接方式,通过筛库的办法同时将不同拼接方式的克隆筛选出来可能性较小,而使用  PCR  扩增后,有利于观察到不同的拼接方式。另外,为研究基因在不同组织中表达情况,常根据差异显示法找出特异的  mRNA。  



3.2  从全长  cDNA  文库中进行杂交筛选  



3.2.1  标记探针  cDNA  文库筛选法  



  cDNA  文库通常涂抹到母盘培养基上,然后再把这些菌落的样品吸印到硝酸纤维素膜或尼龙膜上;这时加入标记的探针,如果出现杂交信号,那么从母盘上就可以把包含杂交信号的菌落分离、培养出来。以此筛选出阳性克隆,进行序列分析,以获得  cDNA  全长。该方法能避免  PCR  扩增的非特异性扩增或错配,是一种比较准确可靠的  cDNA  克隆方法。主要缺点是克隆过程需要一系列的酶促反应、产率低、费时长、工作量大。该方法适合于表达丰度高的基因的筛选分离。用于做标记探针的  DNA  片段可以是其它生物的基因片段,在这种情况下筛选出来的基因往往是已分离基因的同源基因;如果用于做标记探针的  DNA  片段是通过新分离蛋白质的氨基酸反推设计的  DNA  序列,或者是特异分子标记子  DNA  序列,那么可以筛选得到新功能基因。  



3.2.2  反式  PCR  



  反式  PCR  克隆  cDNA  全长的基因原理是:双链  cDNA  合成后进行尾—尾连接,环化的  cDNA  用位于已知序列内的限制性内切酶酶切位点造成缺口或用  NaOH  处理使之变性,然后用2条基因特异性引物对重新线性化或变性的  cDNA  进行扩增。反式  PCR  的优势在于,它采用了2条基因特异性引物,因此不易产生非特异性扩增。该方法可以快速、高效地扩增  cDNA  或基因组中已知序列两侧位置的片段。  



4  小结  



  随着生物及信息技术的迅速发展,寻找新基因、克隆新基因、进而研究基因的功能已成为功能基因组研究中的一项重要工作。在过去寻找新基因的方法中,以消减杂交、mRNA  差异显示,cDNA  的代表性差异显示分析法、差异消减展示等方法应用最广。这些方法在新基因的发现方面都各有其独特的优势,可寻找出一些差异表达序列,但这些差异表达序列大部分情况都是不完整的基因。目前,比较可行而且应用较多的方法主要还是  cDNA  文库的筛选。一方面  cDNA  文库只代表一定时期一定条件下正在表达的基因,是整个真核基因组中的少部分序列,因此  cDNA  克隆的复杂程度比直接从基因组克隆的要小得多;另一方面由于每个  cDNA  克隆只代表一种  mRNA  序列,因此在基因克隆过程中出现假阳性的概率比较低,所以  cDNA  文库的构建已成为当前分子生物学研究和基因工程操作的基础。本文涉及到的有关  cDNA  文库构建方法,是目前比较常用的,这些方法各有优缺点,研究者应根据自己的实际情况,选择合适的技术,已达到自己预期的目的。
作者:
医学百科App—中西医基础知识学习工具
  • 相关内容
  • 近期更新
  • 热文榜
  • 医学百科App—健康测试工具