氨基酸测序

发布时间:2026-04-16 阅读量:12 作者:生物检测中心

氨基酸测序:揭示蛋白质身份与功能的密码

蛋白质是生命活动的核心执行者,其功能由其独特的一级结构——即氨基酸的排列顺序(序列)——所决定。氨基酸测序(Protein Sequencing),或称蛋白质测序,就是解读这个由20种天然氨基酸以特定顺序连接而成的线性密码的过程。这项技术在生物学、医学、生物技术等领域具有举足轻重的作用。

核心目标与方法策略

氨基酸测序的核心目标是确定构成蛋白质或多肽链的氨基酸种类及其精确排列顺序。主要策略分为两大类:

  1. 间接法:基因推导测序

    • 原理: 大多数蛋白质的氨基酸序列由其编码基因的核苷酸序列决定(遵循遗传密码)。因此,通过测定编码该蛋白质的基因或互补DNA(cDNA)序列,可以推导出相应的氨基酸序列。
    • 流程: DNA/RNA提取 -> PCR扩增或文库构建 -> DNA测序(如Sanger法或高通量测序技术)-> 序列比对与翻译 -> 推导出氨基酸序列。
    • 优点: 高通量、速度快、成本相对较低,尤其适用于已知基因或可获取基因组的样本。
    • 局限性: 无法检测转录后修饰(PTMs)、无法区分高度同源的异构体、不能直接应用于无法追溯基因来源的蛋白质(如复杂混合物中的蛋白质、古生物样本)。
  2. 直接法:蛋白质/多肽化学或物理测序

    • 原理: 直接对蛋白质或多肽分子本身进行操作,通过化学降解或物理碎裂方式,逐步或片段化地确定氨基酸序列。
    • 关键方法:
      • Edman降解化学法 (传统方法):
        • 原理: 基于苯异硫氰酸酯(PITC)与多肽链N端游离α-氨基的特异性反应。反应后,在酸性条件下选择性切割下N端第一个氨基酸衍生物(PTH-氨基酸),并通过色谱技术(如HPLC)进行鉴定。此过程循环进行,逐个测定N端氨基酸。
        • 优点: 直接、可靠,能从头开始测序。
        • 局限性: 通量低、耗时长、对样品纯度要求极高、难以处理N端封闭的蛋白质、成本高,通常适用于短肽(<50个氨基酸)或作为质谱测序的辅助验证。
      • 质谱法 (主流方法):
        • 原理: 利用质谱技术测定蛋白质或多肽的分子量,并通过特定的碎裂技术(如碰撞诱导解离CID、高能碰撞解离HCD、电子转移解离ETD、电子捕获解离ECD)将肽段打碎成离子碎片。
        • 关键步骤:
          • 蛋白酶解: 通常使用胰蛋白酶(Trypsin)等特异性蛋白酶将蛋白质切割成更小的肽段(肽段长度更适用于质谱分析)。
          • 色谱分离: 液相色谱(LC,如HPLC或纳升级LC)将复杂肽段混合物分离,依次送入质谱。
          • 质谱分析:
            • 一级质谱 (MS): 测定完整肽段的分子量(质荷比 m/z)。
            • 二级质谱 (MS/MS): 选择特定肽段离子(母离子)进行碎裂,产生碎片离子谱图(主要包含b-离子和y-离子系列)。
          • 序列解析:
            • 数据库搜索: 将实验获得的肽段分子量和碎片离子谱图(MS/MS谱图)与理论蛋白质数据库中所有蛋白质酶解后产生的理论肽段及其理论碎片谱图进行比对(利用搜索算法如SEQUEST, Mascot, MaxQuant等)。找出匹配度最高的肽段序列及所属蛋白质。
            • 从头测序: 当目标蛋白质序列不在现有数据库中(如新蛋白质、突变体、宏蛋白质组)时,需要直接从碎片离子谱图中解读出肽段的氨基酸序列。这需要专家分析碎片离子的规律(如b/y离子间的质量差对应氨基酸残基质量)。
        • 常用质谱仪类型: 串联质谱(如Q-TOF, Orbitrap系列, Triple Quadrupole, Ion Trap)。
        • 优点: 高灵敏度、高通量、可处理复杂混合物、能鉴定翻译后修饰(通过碎片谱图上的修饰特征质量偏移)、是现代蛋白质组学研究的支柱技术。
        • 局限性: 从头测序算法仍在发展中(相对于数据库搜索),对极端复杂样本的深度覆盖仍有挑战,仪器成本高。
 

关键挑战与核心难点

  • 样品复杂性: 生物样本通常包含成千上万种蛋白质。有效的分离(如凝胶电泳、色谱)或特异性富集是关键的前处理步骤。
  • 翻译后修饰 (PTMs): 磷酸化、糖基化、乙酰化等修饰极大地增加了蛋白质的多样性和复杂性,改变分子量并影响酶解效率和碎片模式。需要特定的富集方法和敏感的质谱碎裂/检测策略。
  • 从头测序: 不依赖于数据库,直接从质谱碎片谱图推导出新序列(尤其涉及修饰或突变时),需要高质量的谱图和先进的算法,仍是技术难点。
  • N端/C端封闭: 蛋白质N端乙酰化或焦谷氨酸环化、C端酰胺化等会导致传统Edman降解失效或质谱N端/C端信号弱。
  • 低丰度蛋白质: 在复杂样本中,低丰度目标蛋白的信号容易被高丰度蛋白掩盖,需要高灵敏度的检测和有效的分级分离。
  • 大分子量及难溶蛋白: 超大蛋白质或膜蛋白等的有效酶解和质谱分析更具挑战性。
 

广泛的应用领域

  1. 生物医学研究:
    • 疾病生物标志物发现: 比较健康与疾病状态(如血浆、尿液、组织)的蛋白质组差异,发现潜在的诊断、预后或疗效监测标志物(如特定蛋白序列变异体)。
    • 药物靶点鉴定与验证: 识别与药物相互作用的蛋白质及其具体作用位点(通过测定药物结合后蛋白质的序列变化或修饰)。
    • 抗体表征: 精确测定治疗性单克隆抗体的氨基酸序列(包括互补决定区CDR),确认其一致性、完整性、有无突变或修饰,是生物仿制药开发和质控的核心。
    • 翻译后修饰研究: 精确定位磷酸化、糖基化位点等,阐明其在信号转导、蛋白质功能调控中的作用。
    • 蛋白质错误折叠疾病研究: 分析淀粉样蛋白等异常聚集蛋白的序列和修饰状态。
  2. 生物技术与制药:
    • 重组蛋白药物开发与质量控制: 确保生产的治疗性蛋白(如胰岛素、生长因子、细胞因子、抗体)具有正确的氨基酸序列,是放行的关键指标之一。
    • 酶工程: 测定改造后酶的序列,确认突变位点,关联序列与功能改进。
    • 生物仿制药分析: 深度表征生物仿制药与原研药的氨基酸序列一致性。
  3. 基础生物学研究:
    • 新基因产物鉴定: 通过质谱鉴定基因组预测的新基因所表达的蛋白质序列。
    • 蛋白质相互作用研究: 鉴定免疫共沉淀或交联实验中与目标蛋白相互作用的伴侣蛋白(通过质谱分析共沉淀或交联复合物组分)。
    • 物种鉴定与进化: 通过比较同源蛋白的序列差异研究物种进化关系。在古蛋白质组学中用于分析古代生物遗骸中的蛋白质序列。
  4. 食品科学与法医学:
    • 过敏原检测: 识别食品中痕量的致敏蛋白成分。
    • 物种来源鉴定: 确定肉制品、乳制品等的真实物种来源。
    • 法医证物分析: 从毛发、皮肤残留物等中获取蛋白质序列信息进行个体识别(尤其在DNA降解严重时)。
 

未来展望

氨基酸测序技术仍在飞速发展:

  • 更强大的质谱技术: 更高分辨率、更高灵敏度、更快扫描速度的质谱仪不断涌现,提升检测深度和通量。
  • 先进的碎裂技术与算法: ETD/ECD等技术更好地保留不稳定修饰位点;人工智能(AI)和机器学习(ML)在谱图解析(尤其是从头测序)、修饰位点预测、蛋白质鉴定准确性方面潜力巨大。
  • 单分子测序: 探索基于纳米孔或荧光成像等原理的直接蛋白质单分子测序技术,有望规避酶解过程,实现超长序列甚至完整蛋白质的读取。
  • 原位与空间蛋白质组学: 结合显微成像与质谱(如MALDI成像质谱、空间分辨组学技术),在组织原位获取蛋白质序列和丰度信息及其空间分布。
  • 整合多组学分析: 将蛋白质序列信息与基因组、转录组、代谢组数据整合,构建更全面的生命活动模型。
 

结语

氨基酸测序是解锁蛋白质结构与功能奥秘的金钥匙。从经典的Edman降解到现代主流的质谱技术,不断进步的方法学极大地推动了生命科学和医学研究的边界。随着技术的持续革新,特别是质谱性能的提升和人工智能的深度融入,氨基酸测序将在精准医学、新药研发、合成生物学等领域展现出前所未有的力量,持续深化我们对生命复杂运作机制的理解,并为解决重大健康挑战提供关键洞见。