重组蛋白表达&纯化

发布时间:2025-06-14 08:32:58 阅读量:4 作者:生物检测中心

重组蛋白,即利用基因工程技术,将外源基因导入宿主细胞,使其表达并产生目标蛋白质,已成为现代生命科学研究和生物医药产业的核心技术。其在抗体药物、疫苗开发、结构生物学、诊断试剂、酶工程等领域应用广泛。高效的重组蛋白表达与纯化工艺,是获取高活性、高纯度目标蛋白的关键环节。本文系统阐述从基因克隆到最终获得纯化蛋白的技术流程、策略与挑战。

第一部分:技术路线概览

重组蛋白生产遵循以下核心流程

  1. 目标基因获取与优化
  2. 载体构建与克隆
  3. 宿主细胞选择与转化
  4. 表达培养与诱导
  5. 细胞收获与裂解
  6. 粗蛋白提取
  7. 蛋白纯化(多步层析)
  8. 浓缩、缓冲液置换与精制
  9. 质量检测与分析
  10. 保存

第二部分:基因克隆与载体构建

1. 目标基因来源

  • cDNA文库
  • PCR扩增(基因组DNA或cDNA模板)
  • 化学合成基因(最优选择:密码子优化,特别是对于稀有密码子;去除隐秘剪接位点、不稳定序列)

2. 表达载体关键元件

  • 启动子(Promoter) : 控制转录起始(T7/lac, T5/lac, AraBAD, AOX1, CMV等)
  • 核糖体结合位点(RBS) : (原核)决定翻译效率
  • 多克隆位点(MCS) : 外源基因插入位点
  • 融合标签(Expression Tag) : 常附加在基因N/C端以促进可溶性表达、简化纯化、提高产量
    • 纯化标签: His-tag (6xHis, 镍柱IMAC), GST (谷胱甘肽亲和层析), MBP (麦芽糖亲和层析), Flag, Strep-tag II
    • 可溶性标签: MBP, GST, Trx, SUMO, NusA (特别适用于难溶蛋白)
  • 筛选标记(Selection Marker) : 抗性基因(氨苄Amp, 卡那Kan, 博来霉素Ble, 潮霉素Hygro等)
  • 起点(Origin of Replication, ori) : 决定拷贝数
  • (真核) 信号肽(Secretory Signal Sequence) : 引导分泌表达
  • (真核) 多聚腺苷酸化信号(PolyA) : 保证mRNA稳定性

3. 克隆策略

  • 限制性内切酶 & DNA连接酶
  • 无缝克隆/同源重组 (Gibson Assembly, In-Fusion, SLIC):效率高、无序列限制
  • TA/TOPO克隆:简便快捷
  • Gateway克隆:适用于高通量
  • 验证: 酶切鉴定、测序确认

第三部分:宿主表达系统选择(核心决策点)

宿主系统 代表宿主 优势 局限性
原核系统   成本低、操作简单、生长快、产量高 缺乏翻译后修饰(PTM)、易形成包涵体(不溶性聚集)、复杂蛋白难表达、毒素影响
大肠杆菌(E. coli) BL21(DE3), Origami, Shuffle, Rosetta 最常用系统;Rosetta提供稀有tRNA;Shuffle促进二硫键形成;多种商业化载体与菌株 难以表达含二硫键多的真核蛋白或大于~80kDa的蛋白;无糖基化(无法用于生产治疗性抗体等需要修饰的蛋白)
真核系统   可进行复杂PTM(糖基化、磷酸化等)、可分泌表达、适于大分子量或复杂多聚体蛋白表达 成本高、操作复杂、周期长、产量可能较低
酵母      
  - 酿酒酵母(S. cerevisiae) INVSc1, BY4741 遗传背景清晰、操作类似细菌、可糖基化 糖基化类型为高甘露糖型(与人不同、免疫原性问题)、分泌效率可能有限
  - 毕赤酵母(Pichia pastoris) X33, GS115, KM71H 高密度发酵、高产量、强诱导型启动子(AOX1)、可实现适度糖基化(需工程改造菌株)、高效分泌表达 糖基化仍需进一步人源化(常用菌株GlycoSwitch)、部分蛋白可能被酵母蛋白酶降解(需蛋白酶缺陷型菌株)
昆虫细胞      
  - 杆状病毒表达系统(BEVS) Sf9, Sf21, High Five (BTI-TN-5B1-4) 适于大分子量蛋白、多亚基复合物;可进行复杂PTM(较酵母更接近哺乳动物) 需构建重组病毒、流程较长(~4-6周)、杆状病毒糖基化仍非完全人源化、存活力随感染时间下降
哺乳动物细胞      
  - 瞬时表达 HEK293, CHO, COS-7 可进行高度复杂且接近天然的人源PTM(糖基化模式最优)、表达复杂蛋白(如全长膜蛋白、复杂抗体)成功率高 瞬时转染成本极高、产量相对低(但近年提升显著)、培养条件要求高、批间差异可能稍大
  - 稳定细胞系 CHO(最常用), NS0, SP2/0, HEK293 一旦建立,可大规模、稳定、持续生产高修饰蛋白(治疗性蛋白首选平台) 构建稳定细胞系周期长(3-6个月甚至更长)、成本高昂、需筛选高表达克隆

选择依据

  • 蛋白性质: 大小、结构复杂性(多聚体、结构域)、所需PTM(特别是糖基化对功能/治疗性的重要性)、二硫键数目与位置。
  • 目标用途: 研究用少量蛋白(原核/瞬时转染)vs. 结构解析(高纯度、可溶)vs. 治疗性生产(高PTM准确性、高稳定性、CHO为主)。
  • 成本与时间要求
  • 表达形式: 可溶?包涵体?分泌?

第四部分:蛋白表达优化(解决瓶颈)

通用策略

  • 温度优化: 降低温度(常降至16-25°C)促进可溶表达,尤其对于易聚集的蛋白。
  • 诱导条件优化
    • 诱导时机(细胞生长阶段OD600)
    • 诱导剂浓度(IPTG, 甲醇, 四环素等)
    • 诱导时间(随宿主和目标蛋白变化)
  • 培养基与培养条件: 丰富培养基 vs. 确定成分培养基;溶解氧控制(尤其高密度发酵)。
  • 融合标签策略(见前述) 。
  • 分子伴侣/折叠酶共表达: (如E. coli中DnaK-DnaJ-GrpE和GroEL-GroES系统;或表达PDI处理二硫键)。
  • 启动子选择: 强弱可控(如T7强,trc适中)。
  • 密码子优化: 使用宿主偏好的密码子,解决稀有密码子导致的翻译暂停和错误折叠。
  • 信号肽筛选: 对于分泌表达,选择高效信号肽(如PelB, OmpA, α-factor, HSA)。

应对包涵体表达

  1. 包涵体变复性策略
    • 收获细胞,裂解,离心收集包涵体
    • 用强变性剂(如6-8M尿素或4-6M盐酸胍)和还原剂(如10-100mM DTT或50mM β-巯基乙醇)溶解
    • 复性(Refolding) : 去除变性剂/还原剂,使蛋白重折叠。常用方法:
      • 稀释复性:直接稀释到复性缓冲液中(含氧化还原对、分子伴侣、精氨酸、低pH值等助溶剂)。
      • 透析复性:透析逐步降低变性剂浓度。
      • 柱上复性:蛋白结合在层析柱上(如IMAC)进行复性清洗。
    • 复性成功率差异大、优化困难,是工艺瓶颈。
  2. 尝试其他宿主/标签/条件: 优选实现可溶表达。哺乳动物/昆虫系统形成包涵体较少。

第五部分:细胞裂解与粗提物制备

  • 收获细胞: 离心或过滤。
  • 裂解方法
    • 原核细胞/酵母
      • 物理法: 高压均质 (最常用高效)、超声破碎 (小规模)、冻融研磨、珠磨。
      • 化学/酶法: 溶菌酶处理(E. coli)、渗透压冲击、去垢剂(用于膜蛋白)。
    • 昆虫/哺乳细胞: 相对脆弱,常使用温和去垢剂裂解或反复冻融。大规模常用低压均质。
  • 澄清(Centrifugation/Filtration) : 高速离心或深层过滤去除细胞碎片和大颗粒物,获得澄清的粗提物(裂解上清液) 。对于分泌表达蛋白,细胞上清即为粗提取物。关键步骤直接影响后续层析效果。

第六部分:蛋白纯化技术(层析法为核心)

纯化过程通常包含2-4步不同原理的层析步骤(Capture → Intermediate Purification → Polishing),以达到所需高纯度(常>95%,治疗用要求更高)。

核心层析技术

类型 分离原理 特点/应用 关键点/缓冲液
亲和层析(Affinity Chromatography, AC) 生物特异性或强亲和力(标签-配基;抗原-抗体;酶-底物) 捕获步骤首选!特异性高、一步高纯度(80-95%)、载量高、纯化速度快His-tag蛋白纯化的绝对主力 (His标签与固定化Ni²⁺/Co²⁺结合)。 结合:含适量咪唑(10-50mM)的缓冲液(pH~7-8)。洗脱:高浓度咪唑(150-500mM)竞争洗脱或低pH。防止金属离子脱落
离子交换层析(Ion Exchange Chromatography, IEX) 蛋白表面电荷与固定相带相反电荷离子基团静电作用 高分辨率、高载量、常用。阴离子交换层析(AEX): pH>pI时蛋白带负电荷(结合Q基团)。阳离子交换层析(CEX): pH<pI时带正电荷(结合S/SP基团) 通过改变缓冲液离子强度(盐浓度梯度)或pH梯度洗脱。起始低盐上样结合,提高盐浓度洗脱 (NaCl梯度)。缓冲液保持离子强度稳定
疏水作用层析(Hydrophobic Interaction Chromatography, HIC) 蛋白疏水区与固定相疏水配基在高盐环境中作用力 基于表面疏水性分离,适于分离疏水性相近的杂质或去除聚集体。常作为中间纯化步骤 结合:高盐浓度 (1-2M (NH₄)₂SO₄或Na₂SO₄)。洗脱:降低盐浓度(疏水作用减弱)。避免过高盐长时间作用致蛋白沉淀
尺寸排阻层析(Size Exclusion Chromatography, SEC)/凝胶过滤(Gel Filtration, GF) 分子大小和形状(按水力学体积不同进入/排阻于凝胶孔) 精纯步骤核心!更换缓冲液(脱盐)、去除聚集体(多聚体/降解片段)、分离大小相近杂质效果佳。不依赖结合。 保持低流速,精确控制样品体积(<柱体积2-5%)。常用缓冲液不含盐或含少量盐。分辨率高但载量低
混合模式层析(Multimodal/ Mixed Mode Chromatography, MMC) 同时包含多种作用力(如IEX+HIC/AC) 可能提供独特选择性,有效去除特定杂质,减少纯化步骤 结合/洗脱条件需优化(盐/离子强度/溶剂/配基浓度/pH)
(备选) 疏水电荷诱导层析(HCIC) 低盐下依赖电荷和疏水性的复杂相互作用 部分情况下可替代HIC,可在低盐下操作 优化条件与目标蛋白特性强相关

纯化策略组合示例

  1. (His-Tag蛋白) : IMAC (Capture + 快速纯化) → IEX或HIC (Intermediate Purification) → SEC (Polishing, 脱盐/去聚集体) = >95%纯度标准流程
  2. (分泌型抗体-Fc融合蛋白) : Protein A/A/G/L亲和层析 (Capture, 特异结合Fc) → 低pH灭活病毒 (常用工艺) → CEX (流穿模式去除杂质如HCP/DNA/Protein A脱落或聚合物) → AEX (流穿模式进一步精纯) → (可选的) SEC/VF (精纯/浓缩) 。治疗性抗体核心流程。
  3. (无标签可溶蛋白) : 粗提物适当前处理 (盐溶/盐析、超滤) → IEX (主要Capture/Intermediate) → HIC或MMC (Intermediate) → SEC (Polishing) 。

辅助技术

  • 沉淀法
    • 硫酸铵沉淀: 部分纯化与浓缩,去除部分杂质。
    • 有机溶剂/聚合物沉淀: 特定蛋白适用。
  • 超滤/渗滤(Ultrafiltration/Diafiltration, UF/DF) : 关键步骤! 用于浓缩样品、更换缓冲液(如纯化后将蛋白置换到储存缓冲液)、去除小分子杂质。根据目标蛋白分子量选择合适截留分子量(MWCO)的超滤膜。易造成膜吸附损失和剪切力(尤其在浓缩高浓度蛋白时需注意)。
  • 病毒清除/灭活(治疗用) : 对生产过程中可能存在的病毒污染进行控制(如低pH孵育、S/D处理、纳米过滤、特殊层析)。
  • 无菌过滤: 最终制剂的分装前处理。

第七部分:质量检测与分析(确认纯度和特性)

  • 纯度检测
    • SDS-PAGE (还原/非还原) : 最基础手段,直观观察主带大小和杂质带,分析纯度(Scan软件估测)。
    • 高效液相色谱(HPLC) :
      • SEC-HPLC: 检测单体含量和聚合体/降解片段。
      • RP-HPLC (反相色谱): 高分辨率分离,检测微小杂质和疏水变异体。
      • IEX-HPLC: 检测电荷异质性(如糖基化差异、脱酰胺化、氧化)。
  • 浓度测定
    • UV280吸光度: (A_{280} = \frac{Absorbance}{extinction\ coefficient\ \times\ pathlength}) 快速简便。
    • BCA/Bradford法: 比色法,对抗干扰能力稍强。
  • 分子量确认
    • SDS-PAGE: 表观分子量。
    • 质谱(Mass Spectrometry, MS): 最准确分子量(尤其是MALDI-TOF或ESI),可检测PTM(如糖基化修饰、磷酸化、特定突变)。
  • 结构表征
    • 圆二色谱(Circular Dichroism, CD): 评估二级结构(α-螺旋、β-折叠含量)。
    • 动态光散射(Dynamic Light Scattering, DLS): 评估溶液中蛋白大小分布和聚集体。
    • (高阶) X射线晶体学/Cryo-EM/NMR: 高级结构解析(科研常用)。
  • 功能活性检测(Functional Assay) : 核心!确保蛋白具有预期生物活性。根据蛋白性质选择特定方法(如酶促动力学、细胞活性检测、结合ELISA/SPR/BLI分析亲和力)。
  • 其他: 内毒素检测(LAL法,治疗用关键)、宿主细胞蛋白残留(HCP ELISA)、宿主DNA残留(qPCR)、Protein A残留(治疗性抗体)。

第八部分:工艺挑战与未来趋势

持续挑战

  1. 可溶性与折叠: 难溶蛋白表达/复性仍是难点(占目标基因的30-50%)。
  2. 翻译后修饰(PTM)准确性: 非哺乳动物系统(E. coli/酵母/昆虫)的糖基化等修饰与人体差异显著,限制了其应用(需工程改造宿主或选用哺乳动物)。
  3. 宿主相关杂质清除: 高效去除HCPs/HCDNA(残留是关键质量属性CQA)。
  4. 聚体控制: 防止加工/储存中聚集体形成(SEC虽有效但其载量和通量低)。
  5. 成本与效率: 哺乳动物细胞培养与纯化过程成本高昂(治疗性蛋白瓶颈)。
  6. 工艺放大(Scale-Up) : 从实验室规模放大到生产规模保持产品质量一致性的复杂性(流体特性、层析柱均一性等)。
  7. 生物安全风险(病毒/朊病毒) : 特别是人/动物源性原材料的使用。

创新趋势

  1. 人工智能与机器学习(AI/ML) :
    • 预测蛋白溶解性/表达水平/PTM位点/聚集倾向,指导基因和宿主优化。
    • 预测层析图谱优化分离条件
    • 辅助细胞培养过程控制
  2. 细胞培养技术创新
    • 持续流培养(Perfusion)提高细胞密度和产量。
    • 细胞株工程改造优化生长、代谢、蛋白质量。
    • 无血清/化学成分确定培养基开发提高安全性和一致性。
  3. 新型表达系统
    • 体外无细胞表达系统(Cell-Free Protein Synthesis, CFPS) : 灵活快速小规模表达,可引入非天然氨基酸,无细胞限制。成本是限制因素。
    • 工程化藻类、植物细胞系(生物安全性好,成本潜力)。
  4. 先进纯化技术
    • 连续流层析(Continuous Chromatography) : 提高层析柱利用率和生产效率,减少缓冲液消耗(如模拟移动床SMB技术)。
    • 高容量/高选择性层析介质: 改进配基设计(如高载量Protein A填料、新型多肽配基)。
    • 膜层析(Membrane Chromatography) : 利用膜对流特性加快流速,适合早期Captuer和大体积样品处理,逐步用于最后精纯。
    • 多维度/集成纯化工艺平台: 减少步骤提高效率。
  5. 高度自动化与微型化: 高通量筛选表达克隆与纯化条件(配合96/384孔板、机械臂)。
  6. 精准糖工程与修饰控制: 在CHO等宿主中精确调控糖链结构(如开发均一的Fc-岩藻糖敲除抗体提高ADCC效应)。

结论

重组蛋白表达与纯化是一个高度技术性和策略性的过程。从最初的基因设计优化、到宿主表达系统的精确选择、再到裂解和高效多步层析纯化策略的制定,每个环节都深刻影响最终产物的产量、纯度、活性和稳定性。尽管面临诸多技术挑战(如蛋白折叠、PTM调控、杂质清除、成本控制),但不断涌现的新技术和智能化方法(AI、连续生产、新型表达平台)正持续提升工艺效率和产品质量。对基本原理的透彻理解、对细节的精准把控以及对新技术的敏锐洞察与应用,是成功获取功能活性重组蛋白的基石。随着生物药市场的持续增长和精准生物医学的深化,重组蛋白表达纯化技术将继续向着更高效率、更高可靠性、更低成本、更智能化的方向演进。