②免疫反应鉴定法。在既无可供选择的基因表型特征,又无合适探针的情况下,本法是筛选特异cDNA克隆的重要途径。用表达型载体构建的cDNA文库,可利用免疫学方法分组逐一鉴定各cDNA的表达产物,即以某种蛋白质的抗体寻找相应的特异cDNA克隆。
分离得到含有目的基因的阳性克隆后,必须对其作进一步的验证核鉴定,主要是进行限制酶图谱的绘制、杂交分析、基因定位、基因测序以及确定基因的转录方向、转录起始点等。
13.3.2RT‐PCR法
1985年聚合酶链反应(PCR)创立后,人们将RNA的反转录(RT)和cDNA的聚合酶链式扩增(PCR)结合起来,得到一种新的合成cDNA的方法,即逆转录—聚合酶链反应法(RT‐PCR)。首先经反转录酶的作用从RNA合成cDNA第一链,再以cDNA第一链为模板,扩增合成目的片段。引物可采用OligodT和基因特异性引物,OligodT适用于具有PolyA尾巴的RNA,基因特异性引物适用于目的序列已知的情况。
13.3.3化学合成法
较小的蛋白质或多肽的编码基因可以用人工化学合成法合成。化学合成法有个先决条件,就是必须知道目的基因的核苷酸排列顺序,或者知道目的蛋白质的氨基酸顺序,再按相应的密码子推导出DNA的碱基序列。用化学方法合成目的基因DNA不同部位的两条链的寡核苷酸短片段,再退火成为两端形成黏性末端的DNA双链片段,然后将这些双链片段按正确的次序进行退火使连接成较长的DNA片段,再用连接酶连接成完整的基因。
人工化学合成基因的限制主要有:①不能合成太长的基因。目前DNA合成仪所合成的寡核苷酸片段长度仅为50~60bp,因此此方法只适用于克隆小分子肽的基因。②人工合成基因时,遗传密码的简并会为选择密码子带来很困难,如用氨基酸顺序推测核苷酸序列,得到的结果可能与天然基因不完全一致,易造成中性突变。③费用较高。
13.4工程菌的构建
目的基因获得后,即可进行工程菌(细胞)的构建,使目的基因表达。此时,需要注意的问题有目的基因的表达产量、表达产物的稳定性、表达产物的生物学活性和表达产物的分离纯化。因此在进行工程菌(细胞)构建时,必须综合考虑各种因素,建立最佳的基因表达体系。
13.4.1宿主细胞的选择
目的基因获得后,必须在合适的宿主细胞中进行表达,才能获得目的产物。宿主细胞应满足以下要求:容易获得较高浓度的细胞;能利用易得廉价原料;不致病、不产生内毒素;发热量低,需氧低,适当的发酵温度和细胞形态;容易进行代谢调控;容易进行DNA重组技术操作;产物的产量、产率高,产物容易提取纯化。
用于基因表达的宿主细胞分为两大类,第一类为原核细胞,目前常用的有大肠杆菌、枯草芽孢杆菌、链霉菌等;第二类为真核细胞,常用的有酵母、丝状真菌、哺乳动物细胞等。
13.4.1.1原核细胞
大肠杆菌作为外源基因的表达宿主,遗传背景清楚,技术操作简便,培养条件简单,大规模发酵经济,因此备受重视。目前大肠杆菌是应用最广泛、最成功的表达体系,并常常作为高效表达研究的首选体系。
大肠杆菌表达体系也存在一些缺点。大肠杆菌中的表达不存在信号肽,故产品多为胞内产物,提取时需破碎细胞,故细胞质内其他蛋白质也释放出来,因而造成提取困难。由于分泌能力不足,真核蛋白质常形成不溶性的包涵体,表达产物必须在下游处理过程中经过变性和复性处理才能恢复其生物活性。在大肠杆菌中的表达不存在翻译后修饰作用,故对蛋白质产物不能糖基化,因此只适于表达不经糖基化等翻译后修饰仍具有生物功能的真核蛋白质,在应用上受到一定限制。由于翻译常从甲硫氨酸的AUG密码子开始,故目的蛋白质的N端常多余一个甲硫氨酸残基,容易引起免疫反应。大肠杆菌会产生很难除去的内毒素,还会产生蛋白酶而破坏目的蛋白质。
13.4.1.2真核细胞
(1)酵母
酵母菌是研究基因表达调控最有效的单细胞真核微生物,其基因组小,仅为大肠杆菌的4倍,世代时间短,增殖迅速,可以廉价地大规模培养,而且没有毒性。基因工程操作与原核生物相似。
现已在酵母中成功地建立了几种有分泌功能的表达系统,能够将所表达的产物直接分泌出酵母细胞外,从而大大简化了产物的分离纯化工艺。表达产物能糖基化,特别是某些在细菌系统中表达不良的真核基因,在酵母中表达良好。在各种酵母中,以酿酒酵母的应用历史最为悠久,研究资料也最丰富。目前已有不少真核基因在酵母中获得成功克隆和表达,如干扰素、乙肝表面抗原基因等。
(2)哺乳动物细胞
由于表达的目的产物可分泌到培养液中,细胞培养液成分完全由人控制,因而使产物的分离纯化比较容易。而且,哺乳动物细胞分泌的基因产物是糖基化的,接近或类似于天然产物。但动物细胞生产慢,因而生产率低,而且培养条件苛刻,费用高,培养液浓度较小。
而且,目前用于表达外源基因的细胞均为传代细胞,一般认为传代细胞均是恶性化细胞,因而对使用这类细胞生产重组DNA产品是否存在致癌的问题尚有疑问。
虽然各种微生物从理论上讲都可以用于基因的表达,但由于克隆载体、DNA导入方法以及遗传背景等方面的限制,目前使用最广泛的宿主菌仍然是大肠杆菌和酿酒酵母,建立了许多适合于它们的克隆载体和DNA导入方法。
13.4.2重组载体的构建
不同的表达体系有其对应的载体,如大肠杆菌作受体细胞时,应采用大肠杆菌表达载体;酵母作受体细胞时,应采用对应的酵母表达载体。下面以大肠杆菌表达系统为例,介绍真核基因表达的相关问题。
13.4.2.1载体应具备的条件
根据真核基因在原核细胞中表达的特点,表达载体必须具备下列条件:①载体本身是一个复制子,具有复制起点,能够独立地复制。②应具有灵活的克隆位点和方便的筛选标记,以利于外源基因的克隆、鉴定和筛选。而且克隆位点应位于启动子序列后,以使克隆的外源基因得以表达。③应具有很强的启动子,能为大肠杆菌的RNA聚合酶所识别。④应具有阻遏子,使启动子受到控制,只有诱导时才能进行转录。⑤应具有很强的终止子,以便使RNA聚合酶集中力量转录克隆的外源基因,而不转录其他无关的基因。⑥所产生的mRNA必须具有翻译的起始信号,即起始密码AUG和SD序列,以便转录后能顺利翻译。
13.4.2.2高效表达载体的构建
工程菌(细胞)外源基因表达产量与外源基因拷贝数、基因表达效率、表达产物的稳定性和细胞代谢负荷等因素有关,因此必须从这些因素入手,寻找提高外源基因表达效率的有效途径。
(1)增加外源基因的拷贝数
外源基因是克隆到载体上的,因此载体在宿主细胞中的拷贝数直接关系到外源基因的拷贝数。将外源基因克隆到高拷贝数的表达质粒上,增加外源基因拷贝数,对于提高外源基因的总体表达水平非常有利。
(2)提高外源基因的表达效率
有许多因素,如启动子的强度、核糖体结合位点的有效性、SD序列和起始密码ATG的间距、密码子的组成等都会不同程度地影响外源基因的表达效率。构建载体时,一定要注意这些问题。
①选用强启动子
外源基因在大肠杆菌中的有效表达,首先必须实现从DNA到mRNA的高水平转录。
转录水平的高低受启动子等调控元件的控制,要使目的基因高效表达,在载体目的基因的上游,必须连有一个强启动子。原核细胞表达载体常用的强启动子有lac、trp、tac、PL、bla等。
②增加核糖体结合位点的有效性
大肠杆菌核糖体结合位点对真核基因在细菌中的高效表达十分重要。所以必须增加核糖体结合位点的有效性,消除核糖体结合位点及其附近的潜在二级结构。
③调整好SD序列和起始密码ATG的间距
SD序列和起始密码ATG之间的距离及其序列对翻译效率有明显影响。表达非融合蛋白的关键是原核SD序列和真核起始密码ATG之间的距离,距离过长或过短都会影响真核基因的表达。调整SD序列和起始密码ATG的间距,改变附近的核苷酸序列,可提高非融合蛋白的合成水平。
④选用大肠杆菌“偏爱”的密码子
真核基因与原核基因对编码同一种氨基酸所“偏爱”使用的密码子不尽相同,真核系统中“喜欢用”的密码子,在原核细胞中的翻译效率有可能下降。为了提高表达水平,在根据蛋白质结构来设计引物或合成基因时,应选择使用大肠杆菌“偏爱”的密码子。
(3)提高表达产物的稳定性
当外源基因表达时,细胞内降解该蛋白质的酶由于应激反应,其产量会迅速增加。即使原始表达量很高,由于很快在细胞体内被降解,因而实际产量会很低。为提高表达产物在菌体内的稳定性,可以采用下列几种方法:①组建融合基因,产生融合蛋白。许多融合蛋白与天然的真核蛋白相比较,在细菌体内比较稳定,不易被细菌酶类所降解。②利用大肠杆菌的信号肽或某些真核多肽中自身的信号肽,把真核基因产物运输到胞浆周质的空隙中,使外源蛋白不易被酶降解。③采用位点特异性突变的方法,改变真核蛋白二硫键的位置,从而增加蛋白质的稳定性。④选用蛋白酶缺陷型大肠杆菌为宿主细胞,有可能减弱表达产物的降解。
(4)减轻细胞的代谢负荷
由于基因工程产物在细胞内过量合成,必然会影响宿主的生长和代谢,而细胞代谢的损伤,又抑制了外源基因产物的合成,所以必须合理调节这种消长关系,使宿主细胞的代谢负荷不至过重,又能高效表达外源基因。
为了减轻宿主细胞的代谢负荷,提高外源基因的表达水平,可以采取当宿主细胞大量生长时,抑制外源基因表达的措施。如先抑制重组质粒的复制,当细胞生物量积累到一定水平后,再诱导细胞中重组质粒的复制,增加质粒拷贝数。还可以在载体中设置阻遏子,使启动子受到控制,当宿主细胞增殖积累到相当量,再通过瞬间消除阻遏,使所表达蛋白质在短时间内大量积累。另外,某些蛋白质在真核系统中是可溶性的,但在大肠杆菌中表达后却成为不溶性蛋白质,形成不溶性的包涵体,这种包涵体的形成大大降低了表达产物对宿主的毒害作用。
(5)真核基因的表达形式
此外,在构建基因工程载体时,来源于真核细胞的药物基因在大肠杆菌中的表达形式也是需要考虑的。
①以融合蛋白的形式表达药物基因
为了防止表达的目的蛋白被宿主细胞的酶降解,常将真核蛋白与一条短的原核多肽结合在一起,即得融合蛋白。融合蛋白的氨基端是原核序列,羟基端是真核序列,在菌体内比较稳定,不易被细菌酶类所降解,容易实现高效表达。由于融合蛋白中含有一段原核多肽序列,可能会影响真核蛋白的免疫原性,所以一般不能作为人体注射用药。
经特殊设计,使融合蛋白经特异蛋白酶(如凝血因子X、胶原酶、肠激肽酶等)或化学处理(如CNBr处理)可以切除融合蛋白氨基端的原核多肽,而获得具有生物活性的真核天然蛋白分子。例如,在细菌蛋白和目的蛋白之间加入Lle‐Glu‐Gly‐Arg,这段序列在自然状态的蛋白中较少出现,该序列可被凝血因子Xa识别并在C端切开;另外也可在细菌蛋白和目的蛋白之间加入一个Met,CNBr可在Met处专一性地切割,得到目的蛋白。
②以非融合蛋白的形式表达药物基因
非融合蛋白是指在大肠杆菌中表达的蛋白质以真核蛋白mRNA的AUG为起始,在其氨基端不含任何细菌多肽序列。为此,表达非融合蛋白的操纵子必须改建成:细菌或噬菌体的启动子—细菌的核糖体结合位点(SD序列)—真核基因的起始密码子—结构基因—终止密码。要表达非融合蛋白,要求SD序列与翻译起始密码ATG之间的距离要合适,SD序列与翻译起始密码ATG之间的距离即使只改变2~3个碱基,表达效率也会受到很大的影响。
非融合蛋白能够较好地保持原来的蛋白活性,其最大缺点是容易被蛋白酶破坏。另外,非融合蛋白N末端常常带有甲硫氨酸,在人体内用药时可能引起人体免疫反应。
③分泌型表达蛋白药物基因
外源蛋白的分泌表达是通过将外源基因融合到编码原核蛋白信号肽序列的下游来实现的。利用大肠杆菌的信号肽,构建分泌型表达质粒,常用的信号肽有碱性磷酸酶信号肽、膜外周质蛋白信号肽、霍乱弧菌毒素B亚单位等。将外源基因接在信号肽之后,使之在胞质内有效地转录和翻译,当表达的蛋白质进入细胞内膜与细胞外膜之间的周质时,被信号肽酶识别而切掉信号肽,从而释放出有生物活性的外源基因表达产物。
分泌型表达具有以下特点:一些可被细胞内蛋白酶所降解的蛋白质在周质中是稳定的;由于有些蛋白质能按一定的方式折叠,所以在细胞内表达时具有活性;蛋白质信号肽和编码序列之间能被切割,因而分泌后的蛋白质产物不含起始密码ATG所编码的甲硫氨酸等。但是,外源蛋白分泌型表达过程中也会遇到一些问题,如产量不高、信号肽不被切割或不在特定位置上切割等。