点击显示 收起
σ亚基本身并无催化功能,它的作用是识别DNA分子上的起始信号。在体外实验中可见,在没有σ时,核心酶偶而亦能起始RNA的合成,但有许多起始错误,而且核心酶所合成的RNA链的起始在某个基因的两条链上是随机的。但当σ存在时,则起始在正确的位点上,这说明全酶能够特异性地与启动子相结合。
两类不同的启动子
启动子是DNA分子可以与RNA聚合酶特异结合的部位,也就是使转录开始的部位。在基因表达的调控中,转录的起始是个关键。常常某个基因是否应当表达决定于在特定的启动子起始过程。那末,在某一特定启动子起始转录时是由什么来控制的呢?
启动子一般可分为两类:
(1)一类是RNA聚合酶可以直接识别的启动子。这类启动子应当总是能被转录。但实际上也不都如此,外来蛋白质可对其有影响,即该蛋白质可直接阻断启动子,也可间接作用于邻近的DNA结构,使聚合酶不能和启动子结合。(2)另一类启动子在和聚合酶结和时需要有蛋白质辅助因子的存在。这种蛋白质因子能够识别与该启动子顺序相邻或甚至重叠的DNA顺序。
因此,RNA聚合酶能否与启动子相互作用是起始转录的关键问题,似乎是蛋白质分子如何能识别DNA链上特异序列。例如,RNA聚合酶分子上是否有一个活性中心能够识别出DNA双螺旋上某特异序列的化学结构?不同启动子对RNA聚合酶的亲和力各不同。这就可能对调控转录起始的频率,亦即对基因表达的程度有重要不同。DNA链上从启动子直到终止子为止的长度称为一个转录单位。一个转录单位可以包括一个基因,也可以包括几个基因。
启动子的共同顺序
为什么RNA聚合酶能够仅在启动子处结合呢?显然启动子处的核苷酸顺序具有特异的形状以便与RNA聚合酶结合,就好像酶与其底物的结构相恰恰适合一样。将100个以上启动子的顺序进行了比较,发现在RNA合成开始位点的上游大约10bp和35bp处有两个共同的顺序,称为-10和-35序列。这两个序列的共同顺序如下,-35区“AATGTGTGGAAT”,-10区“TTGACATATATT”。大多数启动子均有共同顺序(consensus sequence),只有少数几个核苷酸的差别。
-10序列又称为Pribnow盒(原核生物)。在真核生物中相应的序列位于-35bp处,称为TATA盒,又称为Goldberg-Hognessbox,是RNA聚合酶Ⅱ的结合部位。-10和-35这两个部位都很重要:[1]RNA聚合酶能和-35和-10序列中的碱基和DNA主链中的磷酸基相接触;[2]离开共同顺序较远的启动子的活性亦较弱;[3]最重要的是,破坏启动子功能的突变中有75%都是改变了共同顺序中的碱基,其余25%亦为离共同顺序较近的。-35和-10序列相距约20bp,即大致是双螺旋绕两圈的长度。因为这两个结合区是在DNA分子的同一侧面,可见此酶是结合在双螺旋的一面。可以想像,它能"感觉到每个结合区的沟底中碱基所产生的特异形状。"
原核生物亦有少数启动子缺乏这两个序列(-35和-10)之一。在这种情况下,RNA聚合酶往往不能单独识别这种启动子,而需要有辅助蛋白质的帮助。可能是这些蛋白质因子与邻近序列的反应可以弥补启动子的这个缺陷。
在真核生物中,在转录起始位点上游70-80bp处有CAAT顺序,也称为CAAT盒。这一顺序也是比较保守的共同顺序:GCCTCAATCT。RNA聚合酶Ⅱ可以识别一顺序。近年来在对家兔β珠蛋白基因CAAT顺序的研究中发现,用人工方法诱导CAAT顺序发生突变使家兔β珠蛋白基因的转录水平降低。
启动子中的-10和-35序列是RNA聚合酶所结合和作用必需的顺序。但是附近其他DNA顺序也能影响启动子的功能。例如,在核糖体RNA合成的起始位点的上游50到150核苷酸之间的顺序就是对启动子的完全活性所必需的。如果这一段DNA顺序缺失并由其他外来DNA所取代(例如克隆在质粒DNA中的rRNA基因),则转录起始的频率将降低10倍。同样,在其他情况下,远隔部位的富有AT的DNA顺序被认为能增进转录起始的频率。有时候上游顺序可以是某些能直接激活RNA聚合酶的"激活蛋白"的结合部位。但是,上游顺序往往有另外的功能。例如上游顺序可以吸引拓扑异构酶,后者可导致结合的局部产生有利于转录起始的超螺旋状态。上游顺序所引起的DNA结构的微细变化可能在双螺旋上被传导到相当远的距离,因此上游顺序的变化可以影响到-10和-35区的DNA结构细节。
RNA聚合酶与启动子的结合
大肠杆菌的RNA聚合酶与启动子结合的过程可分为两步。[1]酶找到启动子顺序并与其以"关闭"复合体形式(即双螺旋形式)相结合。这一步所识别的是-35序列,因为-35序列的突变损害启动子的结合。[2]"关闭"复合体转变为"开放"复合体(即双螺旋被解旋,两条链分开);此时酶的结合比较紧密。在这个转变中-10区约有17bp被解旋,暴露出模板链。-10序列富于AT碱基对,因为AT对比GC对更易于"融化"。-10区的突变可阻碍"开放"复合体的形成。许多突变改变了-10序列中的碱基,但并未减低其AT对的水平,却仍然能阻碍其"融化"为开放复合体,可见-10区除了要易于融化之外,还必须有特异的形状,以便RNA聚合酶能够识别它。
不同启动子需要不同σ因子
E.coli细胞中主要的σ因子可与核心酶一同被纯化,称为σ70,但菌细胞中另外有一些σ因子能够识别其顺序与E.coli的主要启动子不同的另一些启动子,并促使核心酶起始转录。这些变异的σ因子在细胞中有特别功能,通常能剧烈改变细胞RNA的合成方式,以便在需要时使一组全新的基因得以表达。这是在枯草杆菌(Bacillus subtilis)中首次发现的,它们的作用是开启在芽胞形成(sporulation)过程中需要的一整套新的蛋白质的表达。噬菌体往往有其自己的σ因子,借以在噬菌体发育的某一特殊阶段开动其所需要的某些噬菌体基因的转录。
在E.coli中共有17个热休克基因,基因表达有赖于转录改变。基因htpR是其主要调节器,是转到热休克反应所必需的。hrpR的产物是一个32KD的蛋白质,它就是一种变异的σ因子,称为σ32。而将正常的σ因子称为σ70(表示其分子量为70KD)。然而σ32很不稳定,故调控它的表达状况就可以使其量迅速增多减少。σ32能引导核心酶在热休克基因的启动子处起始转录。这些启动子的顺序与正常的共同顺序是不同的。特别是其-10顺序几乎完全不同。
E.coli的不同σ因子识别不同的共同顺序
因子 | 基因 | 功用 | -35顺序 | 间隔距离 | -10顺序 |
σ70 | rpoD | 正常状态 | TTGACA | 10-18bp | TATAAT |
σ32 | rpoH | 热休克 | CNCTTGAA | 13-15bp | CCCCATNT |
σ60 | rpoN | 氮的利用 | CTGGNA | 6bp | TTCGA |
E.coli的另一种σ因子是在氮饥饿时起作用的,称为σ60。正常时E.coli细胞中仅有少量σ60,但当介质中氨缺乏时,σ60即大量增多,以开启某些可利用其他氮源的基因。这就是说,σ60能引导核心酶识别启动子的另一种共同顺序。σ60所识别的-35顺序实际上位于-20处,因为-10和-35两个顺序之间的间距特别短,只有6bp(见表3-32)。
枯草杆菌的正常σ因子(相当于E.coli中的σ70)称为σ43,。它能识别σ70所识别的共同顺序。从一组基因表达变换为另一组基因表达往往需要更换σ因子。这在噬菌体生命周期的裂解(lytic)期和溶源(lysogenic)期的转换中表现最为明显。在噬菌体SP01感染枯草杆菌时即会出现新的σ因子。SP01的感染周期一般可分为三期:[1]刚刚感染时,早期基因被转录。[2]4-5分钟后早期基因转录停止,中期基因开始转录。[3]8-12分钟后中期基因的转录又被晚期基因所取代。早期基因由宿主菌的全酶转录,故仍用σ43。而中期及晚期基因转录则需要新的σ因子来取代原来的σ43。B.subtilis在其芽孢形成细胞中产生新的σ因子。在芽孢形成期开始时σ43即被σ37所取代。
σ分子较σ43略小。它在营养型细胞中即已存在,但为量很少,而且也不和核心酶结合形成全酶。芽孢形成开始时,在σ37的指导下,RNA聚合酶即能转录第一组芽孢形成基因。目前尚不了解,这种替代如何调控的,现在认为机制可能很复杂,牵涉到其他好几种蛋白质。这种替代并不完全,而且被替代下的的σ43也未完全被灭活。大约还有10%的核心酶仍和σ43相结合,所以可能还有某些营养型酶在芽孢形成时仍存在于细胞中。
在营养型细胞中至少还存在另一种σ因子,即σ32。它在芽孢形成早期出现活性,指导某些启动子起始转录;然而含量极少,不到1%。
在芽孢形成开始后4小时,σ29即开始出现。它指导另一组新基因的转录。σ29不存在于营养型细胞中,故可能是芽孢形成基因在σ37转录下的表达产物。
在营养型细胞中还有一种σ28,它的量不多,仅代表RNA聚合酶总活性的一小部分,而在芽孢形成开始时即告失活。然而奇怪的是,在某些不能形成芽孢的突变株中,是找不到它的活性的。所以有人认为,σ28是表示营养已用竭,应当开始芽孢形成反应的信号系统的一个部分。因此,在B.subtilis中,至少发现有7种不同的σ因子,它们可以识别不同的启动子顺序。
枯草杆菌的σ因子及其相应启动子的共同顺序
σ因子 | 来源和用途 | -35顺序 | -10顺序 |
σ43 | 营养生长期 | TTGACA | TATAAT |
σ37 | 芽孢形成期应用 | AGGNTTT | GGNATTGNT |
σ32 | 芽孢形成期应用 | AAATC | TANTGTTNTA |
σ29 | 芽孢形成期合成 | TTNAAA | CATATT |
σ28 | 不应用于芽孢形成期 | CTNAAA | CCGATAT |
gp28 | SP01中期基因表达 | AGGAGA | TTTNTTT |
gp33-34 | SP01晚期基因表达 | CGTTAGA | GATATT |
变异的σ因子所识别的启动子顺序在-35和-10序列方面都和细菌的主要启动子的序列有所不同,所以有人认为σ因子可能同时结合在DNA的这两个部位上。这样,σ因子必然相当长,以便跨越这两个部位之间的距离(约70A)。但亦可能σ因子在转录起始时是相继(而非同时)与这两个部位相结合的。然而,也不一定这样,因为最近有一个令人惊奇的发现,即E.coli的噬菌体T4编码的σ因子促进其"晚期"基因转录时,却仅和-10序列,而不和-35序列相结合;因为T4"晚期"启动子的-35序列可以用基因工程技术加以改变而不影响启动子的功能,说明-35序列不RNA聚合酶与T4晚期启动子结合的特异性。可能这意味着T4的σ因子与启动子很牢固地结合,因而起始结合位点(-35序列)变得不需要了。至少可以认为在此情况下σ主要和-10部位相结合。
调节蛋白与启动子的结合
启动子的效率高低不一。实验显示,与聚合酶结合和开放复合体形成这两个步骤的效率在不同的启动子中是不同的。因此,细胞内不同启动子的效率可有几个数量级的差别──从每10分种以上方有一次转录起始到每1-2秒即有一次起始。这是细胞用以确定基因表达效率的基本方式。 但是即使是同一基因,其转录效率也不是固定不变的。在不同的生长情况下转录可根据需要而改变。在E.coli中转录的调节常常是通过某些蛋白质的介导。这种调节蛋白能够在启动子处或靠近启动子处与DNA分子相结合,从而增高或降低RNA聚合酶起始RNA合成的效率。这些蛋白质中,有的能阻断RNA聚合酶的结合,从而抵制转录,称为阻遏蛋白(repressor);有的能与RNA聚合酶结合并提高其活性,称为激活蛋白(activator)。凡需要激活蛋白才能充分发挥作用的启动子常常与-35共同顺序很不相似,这提示激活蛋白可以取代这个结合位点。作为一种启动子的阻遏蛋白可能是另一种启动子的激活蛋白,反之亦然,这取决于其结合位点的准确位置。一种调节蛋白的名称常常只是反映了它第一次被发现时的功能。
在启动子处影响RNA聚合酶功能的调节蛋白
蛋白质 | 对靶启动子处转录起始的影响 | 在细胞中的功能 |
乳糖阻遏蛋白 | 阻遏作用 | 阻止代谢乳糖的酶的合成(当乳糖不存在时) |
半乳糖阻遏蛋白 | 阻遏作用 | 阻止代谢半乳糖的酶的合成(当半乳糖不存在时) |
LexA阻遏蛋白 | 阻遏作用 | 阻止DNA修复酶的合成(当细胞DNA未受到损伤时) |
λ阻遏蛋白 | 阻遏作用(启动子PL和PR) | 阻止λ生命周期中裂解期需酶的合成 |
λ阻遏蛋白 | 激活作用(启动子PRM) | 通过激活自身启动子而增加其本身的合成 |
CAP蛋白 | 激活作用 | 当葡萄糖不存在时,增加代谢其他糖类的酶的合成 |
CAP蛋白 | 阻遏作用 | 调节本身的基因,并阻止在葡萄不存在时所不需要的蛋 |
gujhy | gujhy | 白质的合成 |
AraC蛋白 | 激活作用 | 当阿拉伯糖存在时,增加利用阿拉伯糖所需要的蛋白质 |
gujhy | gujhy | 的合成 |
AraC蛋白 | 阻遏作用 | 阻止代谢阿拉伯糖的酶的合成(当阿拉伯糖不存在时) |
λcⅡ蛋白 | 激活作用 | 增加建立溶源状态所需的噬菌体蛋白质的合成 |
模板的超螺旋张力
RNA聚合酶首先要在启动子处使DNA解旋才能起始转录。因此,凡有利或不利于解旋的情况就会增高或降低起始的频率。所以细胞内一个重要的条件是DNA模板的超螺旋张力。旋转酶(gyrase)能使细菌的DNA保持超螺旋状态,故有利于解旋。但同时拓扑异构酶Ⅰ能阻止负超螺旋,此酶可使过度的负超螺旋松弛。如这两种酶活性因突变可抵制剂而降低,通常即可使启动子的功能发生相应的改变。所以,DNA旋转录酶抑制剂萘啶酮酸可以抑制许多基因的表达。而编码拓扑异构酶Ⅰ的基因发生突变时可以有相反的作用。即增强某些基因的表达。
但是,增加负超螺旋就一定会增强启动子的功能的说法也不是完全正确的,对于某些启动子这正好相反。这可能是在这些情况下负超螺旋改变了启动子处的DNA的微细构象,使之倾向于抑制RNA聚合酶功能的方向。虽然详细的机制还不明了,DNA旋转酶基因的启动子本身据信就有这样的特性。这是有利于调节负超螺旋的程度的:当细胞DNA的负超螺旋达到足够的程度时,DNA旋转酶的合成就会自动放慢。
此外,某些启动子对超螺旋张力很敏感,而另一些则不很敏感。可能性之一是每个启动子对超螺旋的依赖程度不同,这取决于其不同的顺序。某些启动子的顺序易于融化(故较不依赖于超螺旋),而另一些的顺序较给融化。另一种说法是细菌染色体的不同区域本来就有不同程度负超螺旋,因此,启动子处于染色体的什么区域就是一种重要因素。