第六节 酶的制备

一、酶的来源

目前酶蛋白主要包括三个来源。

1.器官组织等的直接提取

如商品酶猪胰脂肪酶是直接提取自猪胰脏,木瓜蛋白酶提取自木瓜。但直接由器官和组织提取酶有不少不足,器官和组织需要及时处理,而且产能受到样品来源的限制,一些植物来源的酶蛋白还受到时令的制约。因此,这类来源的酶在总酶源中的比重在不断下降。但其好处是可以同时获取多个不同种类的酶。

2.产酶生物的直接培养

这类酶源主要来自微生物,例如深圳绿微康公司生产的脂肪酶就是来自于产脂肪酶的青霉菌等。这些天然的产酶菌株都经过多轮筛选、优化、诱变等处理后大幅度提高其产酶量后方可达到生产水平。但在生产过程中常常有发酵菌株遗传稳定性差、易退化以及总产能相对不高等问题。

3.基因工程异源表达

这是目前酶工程发展最快的方向之一,也将是今后酶蛋白制备的关键。随着生物技术的全面发展,通过基因组提取技术、反转录技术、新一代测序技术和多功能PCR技术可以获得任意生物的基因组,得到相关的酶基因,甚至一些无法培养的微生物的酶基因资源也可以通过宏基因组技术获得。目前用于异源表达的表达体系有如下几大类,分别对应于不同的应用领域和使用范围。

(1)细菌表达体系 大肠杆菌是使用范围最广的表达体系,目前已表达的蛋白质中大约有70%是采用大肠杆菌表达的。大肠杆菌作为表达宿主有以下优点:易转化;在简单的培养基中能快速生长;生长和保存条件要求简单;易表征;可高密度培养;遗传学背景清晰。大肠杆菌作为表达系统的主要缺点包括:不能像真核蛋白那样进行翻译后修饰,缺乏将蛋白质有效释放到培养基中的分泌机制和充分形成二硫键的能力。由于含有热源等物质,不适合表达药用蛋白质。且重组蛋白在大肠杆菌中高水平表达时,易发生积聚或者形成包含体。虽然有种种不足,但大肠杆菌依然是今后酶异源表达的主要工具,其表达速度快、易于后处理等,使其在酶的筛选和定向进化等领域有着独特的优势。枯草杆菌表达体系由于其生物安全性,比大肠杆菌更适合作为食品工业、药用酶和蛋白质的表达,因此也受到充分重视,但其在操作流程和蛋白质表达效率方面都不如大肠杆菌,需要做大量的后续工作以提高其表达效率。

(2)酵母菌表达体系 由于细菌表达体系没有糖基化功能,因此,大量带有糖基化修饰的真核生物来源蛋白转而采用酵母表达体系。目前最常用的酵母菌表达体系为毕氏酵母(Pichia),通过向培养基中添加一定浓度的甲醇可以诱导目标蛋白的表达,并且蛋白的表达水平也很可观。现已有成熟的商业化酵母表达体系出售。但由于毕氏酵母在表达过程中需要添加甲醇,因而也限制了其在许多领域的应用。与之对应的是酿酒酵母表达体系,酿酒酵母是人类使用具有几千年历史的安全菌株,非常适合于食品和药用领域。但其蛋白质表达效率与毕氏酵母体系有不少差距,另外还有其他数种酵母作为表达体系也得到了应用。

(3)霉菌表达体系 霉菌表达体系是目前最重要的商业酶表达体系,由于其可以直接使用大麦、小麦和豆类等作为发酵原料,酶的生产成本可以降得非常低。目前广为采用的是米曲霉和黑曲霉,但由于相关专利大都掌握在诸如诺维信和杰能科等酶制剂巨头手中,其在大规模酶工业化生产时受到限制,随着一些专利的到期,酶的应用会得到更大的发展。

(4)真核细胞表达体系 酵母表达体系虽然能够进行糖基化,但通常会过糖基化,而且糖链成分过于单一,因而对于一些生物医药领域的酶和蛋白质不适合。真核表达系统分瞬时表达体系和持续表达体系。瞬时表达体系的代表为非洲绿猴肾细胞(COS),将外源基因转染表达细胞后可以快速得到大量蛋白,用于快速鉴定基因的功能,宿主细胞没有遗传学改变。持续表达体系适合于工业生产,代表体系是中国仓鼠卵巢细胞(Chinese Hamster Ovary,CHO),由于CHO细胞没有一般真核细胞的传代次数限制,适合大规模培养。并且其属于成纤维细胞,内源蛋白质少,有利于后期纯化,而且其蛋白质糖基化修饰和人源蛋白质最接近。因此,CHO细胞已经成为生物医药领域最重要的表达体系。但由于CHO细胞的培养条件复杂,培养基成本高,不适合用于生产工业用酶,只适合用于生产高附加值的医药用酶和蛋白质。其他真核表达体系还包括昆虫细胞和植物细胞。

(5)无细胞表达体系 由于一些特殊的需要和原因,如一些蛋白质具有细胞毒性,向蛋白质中引入非天然氨基酸,无细胞表达体系应运而生。但目前无细胞表达体系大多应用在高通量筛选、结构蛋白质组学和功能蛋白质组学等少数领域。目前使用较多的包括兔网织红细胞体系、麦芽提取物体系和大肠杆菌体系等。由于其使用成本过高,不适合大规模推广。

二、蛋白质表达常见问题及解决方式

理论上通过基因工程异源表达可以获得任何需要的酶蛋白质,但实际上外源蛋白质的表达经常碰到各种各样的问题而导致表达效率不高,目前常常采取如下一系列手段提高蛋白质的表达效率。

提高大肠杆菌中可溶蛋白的比例需要考虑的问题和策略有:

1.降低蛋白质的合成速度

如:①降低培养温度。最适合大肠杆菌生长的温度在37~39℃之间,在此温度下表达外源蛋白极易生成包含体。低温培养条件下表达外源蛋白能有效地增加可溶蛋白的比例,培养温度的下限一般为8~10℃,因为在此温度以下,大肠杆菌将停止生长,蛋白也基本上停止表达。②用弱启动子。③用低拷贝数的质粒作为表达载体。④降低诱导物的浓度。

2.改变培养基条件

如:①加入能帮助折叠的蛋白质因子;②在培养基中添加甘氨酸能增强外周质蛋白释放到培养基中,且不引起明显的细菌裂解;③在山梨糖醇和甘氨酰甜菜碱存在的渗透压力下培养细菌,可以使可溶性的活性蛋白产量提高多达400倍。

3.与相关蛋白共表达

分子伴侣,如GroES-GroEL、DnaK-DnaJ-DrpE、CIpB;折叠酶,如PPI'S(肽酰脯氨酰顺反异构酶)、DsbA(二硫化物氧化还原酶类)、DsbC(二硫化物异构酶)、PDI(蛋白质二硫键异构酶)。

目前普遍认为,有效的蛋白质翻译后折叠、多肽装配成寡聚体结构以及蛋白质的转位都是由一种被称为分子伴侣的蛋白来介导的。但是,利用分子伴侣所得到的实验结果并不一致,且伴侣分子的共表达对基因表达的影响似乎都具有蛋白质特异性。有报道表明,将人或鼠的蛋白质二硫键异构酶(PDI)与靶基因共表达,能提高在E.coli细胞质中正确折叠蛋白质的产量。E.coli细胞质中二硫键的形成是由维持氧化还原电势的一组蛋白质来促进的。有人认为DsbA(一种可溶性的细胞外周质蛋白)直接催化蛋白质中二硫键的形成,而DsbB(一种内膜蛋白)则参与DsbA的再氧化。真核生物的PDI能够补充DsbA缺失突变株的表型,但其功能在DsbB突变株中完全丧失。另外,通过额外添加谷胱甘肽可以提高PDI增强靶蛋白产生的能力。这些证据表明,PDI有赖于细菌氧还蛋白来完成自身的再氧化。因此,应根据外源蛋白的特点有选择性地共表达分子伴侣和折叠酶。

4.细胞外周质表达和分泌表达

(1)细胞外周质表达 在外周质只有4%的总细胞蛋白,这显然有利于目的蛋白的纯化,外周质的氧化环境有利于二硫键的形成,使蛋白质正确折叠,而胞内则是还原性的环境。周质空间有折叠酶DsbA和DsbC,可以帮助蛋白质的正确折叠,且很少有蛋白酶存在,目的蛋白不会被水解,对细胞有毒性的蛋白可大量存在。

蛋白质通过内膜转运到外周质需要信号肽,在起始密码子和目的基因之间加入信号肽,可以引导目的蛋白穿越细胞膜,避免表达产物在细胞内的过度累积而影响细胞生长,或者形成包含体,而且表达产物是可溶的活性状态,不需要复性。通常这种分泌只是分泌到细胞膜和细胞壁之间的周质空间。

(2)分泌表达 将蛋白质分泌到细胞外易于纯化目的蛋白质,减少细菌的蛋白酶对目的蛋白质的裂解。但是,E.coli在正常情况下只有很少量的蛋白质分泌到细胞外。要解决蛋白质外泌方面的难题,必须弄清E.coli的分泌途径。在E.coli中将蛋白质分泌到培养基中的方法大致分为两类:①利用已有的“真正”的分泌蛋白所采用的途径;②利用信号肽序列、融合伴侣和具有穿透能力的因子。第一种方法具有将目的蛋白质特异性分泌的优点,并最小限度地减少了非目的蛋白的污染。第二种方法依赖于有限渗透的诱导而导致蛋白质的分泌。通常情况下,外泌蛋白质的产量是中等的。

5.表达载体的选择和设计

目前已有多种用于大肠杆菌系统的表达载体,从开始涉及表达的时候可以根据是否要用基因本身的起始密码子进行选择,可选用pET-21(+)、pET-24(+)等载体。如果打算利用载体的起始密码子,那么就有更多的选择。亦可根据是否要可溶性表达,选择加有不同标记的载体。一般说来,在大肠杆菌中不加标记,外源蛋白都会以不溶的包含体形式表达。为了让外源蛋白融合表达,一般说来有三个策略:①与一个高度可溶的多肽联合在一起表达,比如:谷胱甘肽S转移酶(glutathione S transferase,GST)、硫氧还蛋白(thioredoxin,Trx)。②转入一个酶催化二硫键的形成,如:硫氧还蛋白、DsbA、DsbC。③插入一个定位到周质空间的信号序列。不同载体提供不同的标记,有的可以同时带有多个标记。如果不希望在蛋白的N末端加入任何的多肽,可以直接从起始密码子后插入外源片段,或者在得到表达产物后利用蛋白氨基酸的酶切位点把多余的多肽切除。

表达双外源蛋白的载体有pCDFDuet-1 DNA、pETDuetTM-1 DNA、pRSFDuet-1 DNA。这些载体含有两个不同的多克隆位点,可以插入两个外源蛋白基因,利用单独的T7启动子、乳糖操纵子和核糖体结合位点进行表达。载体转化进入合适的菌株中最多可以同时表达8个外源蛋白。

质粒上的元件包括启动子、多克隆位点、终止密码子、融合Tag(如果有的话)、复制子、筛选标记/报告基因等,在进行表达工作之前要做充分的分析,以确认所选载体是否合适。通常表达载体都会选用高拷贝的复制子。pSC101类质粒是以严谨方式复制的,拷贝数低,pCoE1、pMBI(pUC)类的复制子的拷贝数高达500以上,是表达载体常用的。通常情况下质粒拷贝数和表达量是非线性的正相关,当然也不是越多越好,超过细胞的承受范围反而会损害细胞的生长。如果碰巧需要2个质粒共转化,就要考虑复制元是否相容的问题。

氨苄青霉素抗性是最常见的筛选标记,卡那霉素次之,而四环素、红霉素和氯霉素等已经很少使用。抗性基因的选择要注意是否会对研究对象产生干扰,比如代谢研究中要留意抗性基因编码的酶是否和代谢物相互作用。在表达筛选中要注意的问题应该就是LB倒板前加抗生素的温度,温度过高容易导致抗生素失效。

启动子的强弱是对表达量有决定性影响的因素之一,能在E.coli中发挥作用的启动子很多。这些启动子必须具有适合高水平蛋白质合成的某些特性。首先启动子的作用要强,待表达基因的产物要占或超过菌体总蛋白的10%~30%;其次,它必须表现最低水平的基础转录活性。若要求大量的基因表达,最好选用高密度培养细胞和表现最低活性的可诱导和非抑制启动子。如果所表达的蛋白质具有毒性或限制宿主细胞的生长,选用可抑制的启动子则至关重要。

转录终止子对外源基因在大肠杆菌中的高效表达有重要作用——控制转录的RNA长度以提高稳定性,避免质粒上的异常表达导致质粒的稳定性下降。在启动子上游的转录终止子还可以防止其他启动子的通读,降低本底。

在原核生物中,转录终止有两种不同的机制,一种是依赖六聚体蛋白rho的rho依赖性转录终止,rho蛋白能使新生RNA转录本从模板解离。另一种是rho非依赖性转录终止,它特异性依赖于模板上编码的信号,即在新生RNA中形成发卡结构的一回文序列区和位于该回文序列下游4~9bp处的dA、dT富含区。

6.特殊表达菌

大致分为以下几个种类。

(1)蛋白酶缺陷型 所有B菌株的衍生株都是lon蛋白酶和ompT蛋白酶缺陷型的,这包括B834、BL21、BLR、OrigamiTMB、RosettaTM和TunerTM。因此,在纯化时可以保持蛋白的稳定不被降解。BL21(DE3)是应用最多的表达菌株。另外,它的衍生株BLR(DE3)是recA-,RecA是大肠杆菌中介导同源重组的重要蛋白之一。它的缺失,可以保证质粒的稳定。

(2)保证所有细胞以同样的量进行表达 TunerTM株及它的衍生株(OrigamiTMB和RosettaTM)是BL21菌株的lacY1缺失突变型,在这些菌株中可以使蛋白以同样的水平在所有细胞中表达。Lac渗透酶的突变使进入每个细胞的IPTG量都是一致的,这样使蛋白表达浓度可以随着IPTG浓度而改变。通过对IPTG浓度的控制可以使细胞微量表达或者大量表达。一般说来,低浓度表达有利于蛋白的可溶性和活性。

(3)二硫键的形成与溶解性增强 二硫键的形成对某些蛋白的可溶性起到重要的作用,有一些菌株是谷胱甘肽还原酶(gor)和/或硫氧还蛋白还原酶(trxB)缺陷型的,包括AD494、BL21trxB、Origami、Origami B和Rosetta-gamiTM。在这些菌株中表达蛋白,可以更大程度地促进二硫键的形成,并使蛋白以可溶形式和有活性形式出现的可能性增加。

(4)稀有密码子的补给 不同物种有不同的密码子偏爱性,如果外源蛋白中含大量大肠杆菌的稀有密码子,特别是当这些稀有密码子呈连续分布的时候,就会造成蛋白表达量极低,或者翻译提前终止。RosettaTM是为了表达真核蛋白而特别设计的,它含有大肠杆菌稀有的密码子tRNA,包括AUA、AGG、AGA、CUA、CCC和GGA。它们以氯霉素抗性的质粒形式存在。Rosetta系列来自BL21lacY1,所以它具有BL21lacY1的所有特性。

(5)硒蛋氨酸标记 B834是来源于BL21的甲硫氨酸(met)营养缺陷型菌株。它在高度特异活性35S-met标记和晶体成像甲硫氨酸标记中非常有用。

7.融合表达

表达载体的多克隆位点上有一段融合表达标签(Tag),表达产物为融合蛋白(分N端或者C端融合表达),方便后续的纯化步骤或者检测。对于特别小的分子,建议用较大的Tag(如GST)以获得稳定表达;而一般的基因多选择小Tag以减少对目的蛋白的影响。His-Tag是最广泛采用的Tag。

8.基因或者蛋白的大小

一般说来分子量小于5000或者大于100000的蛋白都是难以表达的。蛋白越小,越容易被降解。在这种情况下可以采取串联表达,在每个表达单位(即单体蛋白)间设计蛋白水解或者是化学断裂位点。如果蛋白较小,那么加入融合标签GST、Trx、MBP或者其他较大的促进融合的蛋白标签就较有可能使蛋白正确折叠,并以融合形式表达。对于另一个极端,大于60000的蛋白建议使用较小的标签,如6×组氨酸标签。

9.密码子的偏爱性优化

原核生物和真核生物的基因对同义密码子的使用均表现非随机性。对E.coli中密码子的使用频率进行系统分析得到以下结论:①对于绝大多数的简并密码子中的一个或两个具有偏好;②无论蛋白质的含量多少,某些密码子对所有不同的基因都是最常用的,例如CCG是脯氨酸最常用的密码子;③高度表达的基因比低表达的基因表现更大程度的密码子偏好;④同义密码子的使用频率与相应的tRNA含量有高度相关性。这些结果暗示,富含E.coli不常用密码子的外源基因有可能在E.coli中得不到有效的表达。研究表明,通过用常用密码子替换稀有密码子或与“稀有”tRNA基因共表达可以提高外源基因在E.coli中的表达水平。已知序列的绝大部分(91%)E.coli基因的翻译起始区均含有起始密码子AUG,GUG的利用率为8%,而UUG的利用率则为1%。

枯草芽孢杆菌作为基因工程表达系统发展迅速,其优点为:安全,序列已知,便于操作,无明显的密码子偏爱性和易于表征。枯草芽孢杆菌表达系统的构成涉及了启动子的选择,核糖体结合位点及信号肽的设计。影响外源基因在枯草芽孢杆菌系统中表达的因素主要包括表达载体的选择以及蛋白分泌能力的影响。①选择分子量小、有唯一的酶切位点、较高的拷贝数和适合筛选的抗性标记的载体,其中使用广泛的有Pub110、Pc164和pE194等。②选择可以在菌体中进行穿梭的质粒进行起始克隆,方便基因操作。③选择稳定性好的质粒载体。比如pHB201是由枯草杆菌隐性质粒pTA1060和pUC19构成的穿梭质粒,其在连续传代和发酵罐培养中都比较稳定,许多用于构建大肠杆菌载体的方法也被用于芽孢杆菌载体的构建。这些技术的应用使得芽孢杆菌质粒载体更加完善。影响蛋白分泌能力的因素主要有:①有效分子伴侣的缺乏影响蛋白的分泌,甚至在胞质中形成包含体;②一些信号肽的合成受到时序调节,使得某些外源蛋白的分泌和信号肽酶的合成一致而造成信号肽的切除;③连接在膜外促蛋白折叠因子PrsA的数量影响外源蛋白的高分泌;④蛋白酶的降解导致外源蛋白的低产率;⑤细胞壁成为某些蛋白的分泌屏障。

影响酵母表达系统外源蛋白表达水平的因素及解决办法如下。

甲醇酵母表达系统的优点:它是一种真核表达系统,可对表达的蛋白进行加工折叠和翻译后修饰;具有很高的表达量;节省成本,只需简单的含盐培养基即可;适合于高密度培养;背景杂蛋白少,表达产物较易纯化。

1.外源基因序列的内在特性

为了获得最佳蛋白表达量,应维持外源基因mRNA 5'-UTR尽可能和AOX1 mRNA 5'-UTR相似,并且最好是保持两者一致。此外,5'-UTR中应避免AUG序列以确保mRNA从实际翻译起始位点开始翻译,并且可以通过密码子的替换使起始密码子AUG周围不形成二级结构。(A+T)含量高的基因在甲醇酵母中表达时有时会造成转录提前终止,因此,对(A+T)含量丰富的基因,最好是重新设计序列,使其(A+T)含量在30%~55%的范围内。

外源基因在宿主中的表达会受到酵母偏爱的密码子的影响,通过对外源基因的密码子进行优化可以提高其表达水平。

2.基因拷贝数

一般情况下,甲醇酵母中外源基因整合的拷贝数愈高,则蛋白表达量愈大。事实上,高的基因拷贝数和高的蛋白表达量之间并无必然的联系。因此,有必要在筛选出高拷贝转化子鉴定表达的同时,也显示出单拷贝转化子作为对照,比较两者的表达量。

3.菌株的表型

外源基因转化甲醇酵母后,能够整合到染色体上。整合的不同方式会导致转化子的两种表型。一种方式是插入,即整合后AOX 1基因是完整的,没有被破坏掉。这样转化子代谢甲醇的能力正常,能在甲醇培养基上正常生长,这种表型称为Mut+。另外一种方式是替换,即整合后外源基因取代了受体菌染色体上的AOX 1基因,造成AOX 1基因的丢失。这样转化子代谢甲醇的能力很弱,在甲醇培养基上生长很慢,这种表型称为Mut s。对于胞内表达蛋白,优先考虑用Mut s表型。因为它们有一个低水平的乙醇氧化酶蛋白,表达的蛋白更容易纯化;对于分泌表达,则Mut+和Mut s都可使用。

4.分子伴侣

分子伴侣在细胞内帮助其他蛋白完成正确的组装但不参与这些蛋白所行使的功能,在组装完成后即与之分离。大量的研究报道,分子伴侣与靶基因共表达可显著提高靶蛋白的表达量。

5.信号肽

在毕赤酵母中重组蛋白分泌到胞外必须经过信号肽的引导,由于信号肽与目的蛋白融合表达,从而使目的蛋白在加工折叠后被引导分泌到胞外。常用的酵母信号肽有α因子信号肽(MF-α)、酸性磷酸酯酶信号肽(PHO1)、蔗糖酶信号肽(SUCZ)、Killer毒素信号肽和菊粉酶信号肽(INU)等。

6.糖基化修饰

研究表明,通过对糖基化位点进行改造或引入新的糖基化位点可提高分泌蛋白在毕赤酵母中的表达量及重组蛋白的活性。

7.发酵工艺

高密度发酵是提高毕赤酵母重组蛋白表达量的一种重要策略。毕赤酵母表达外源蛋白时,温度、pH、碳源、溶氧等培养条件对目的蛋白的完整性及产量都有较大的影响,优化培养条件可有效提高外源蛋白的表达量。对培养基的优化主要包括碳源的优化、氮源的优化、基础盐和PTM1微量盐的优化。有多种培养基,如BMGY/BMMY、BMG/BMM、MGY/MM等都可用来表达。BMGY/BMMY、BMG/BMM培养基成分中含有缓冲液,常用来表达分泌蛋白,可在一个广泛的范围内获得最佳的蛋白产量,尤其是当pH值对外源蛋白活力很重要的情况下。甲醇浓度对目的蛋白的表达起着重要的作用,诱导期间培养基中每天应补加甲醇,以弥补甲醇的消耗和蒸发,一般每天添加到培养基中的甲醇含量为培养基体积的0.5%。毕赤酵母可以在较宽泛的pH范围内表达外源蛋白,因此可以通过调节pH值抑制蛋白酶,使降解程度减至最低,提高外源蛋白的产量。此外,在培养基中添加1%酪氨酸蛋白水解物也可减弱蛋白的降解作用。一般发酵罐较摇瓶培养表达量更高。这是因为在发酵罐中,溶解氧水平、通气量、pH值、搅拌速率、营养补给等方面更容易得到优化,导致更高效的表达。