糖基化修饰N-糖肽非标记定量技术:原理、流程与应用
糖基化作为最常见的蛋白质翻译后修饰之一,显著影响蛋白质的结构、稳定性、定位、免疫原性及其与其他分子的相互作用。异常的蛋白质糖基化与多种重大疾病的发生发展密切相关(如癌症、神经退行性疾病、自身免疫性疾病等),使得糖基化位点特异性分析成为生物医学研究的重要前沿。其中,基于质谱(MS)的蛋白质组学技术,特别是针对N-糖肽(N-glycosylated peptides)的非标记定量(Label-Free Quantification, LFQ)分析策略,因其通量高、覆盖度广、无需昂贵同位素标签等优势,在研究复杂生物样本(如血浆、组织、细胞系等)中糖基化修饰的动态变化方面展现出巨大潜力。
一、核心原理与优势
-
非标记定量(LFQ):
- 原理: 无需在样本处理前期引入同位素标记试剂(如SILAC的氨基酸、TMT/iTRAQ的等重标签)。其定量基础是直接比较不同样本中同一肽段(或糖肽)在质谱一级(MS1)层面的信号强度(如峰面积或峰高),或其在质谱图中的出现频率(谱图计数)。
- 优势:
- 成本效益高: 省去昂贵的同位素标签试剂,尤其适用于样本量大的研究。
- 样本灵活性高: 可分析任何来源的样本,无需像SILAC那样预先进行代谢标记(尤其适用于临床组织、体液样本)。
- 无标记引入偏差: 避免了同位素标记效率差异或标记反应副产物对定量准确性的潜在影响。
- 简化实验流程: 无需复杂的标记步骤,实验设计相对简单,减少了样本处理差异。
- 理论上无样本数量限制: 可同时比较多个样本组(但需注意批次效应)。
-
N-糖肽分析:
- 对象: 聚焦于天冬酰胺(Asn, N)连接的糖链修饰的肽段(即N-糖肽)。N-糖基化具有保守的五糖核心结构(Man3GlcNAc2-Asn)。
- 必要性: 传统的基于完整糖蛋白或释放糖链的分析(“糖组学”)丢失了糖基化位点特异性信息。对糖肽(糖链+肽骨架)的直接分析,才能精确地将特定的糖链结构与蛋白质上特定的修饰位点联系起来,实现真正的“位点特异性糖型分析”。
二、关键实验流程与技术要点
-
样本准备: 根据样本类型(细胞、组织、血清/血浆等)进行适当的裂解、蛋白质提取、变性、还原和烷基化等标准前处理步骤,确保蛋白质充分溶解和稳定。
-
糖肽富集(核心步骤):
- 目的: 糖肽在生物样本中丰度低且高度异质性,且非糖肽信号会严重抑制糖肽的检测。富集是提高检测灵敏度和覆盖度的关键。
- 常用富集策略:
- 亲水相互作用色谱法: 利用糖链的高度亲水性,在富水流动相条件下,糖肽比非糖肽更强烈地保留在亲水性固定相上。洗脱后收集富含糖肽的组分。目前应用最广泛的方法之一。
- 凝集素亲和色谱法: 利用植物凝集素(如Con A, WGA, RCA120, SNA等)对特定糖型(末端单糖或特定连接)的特异性结合能力来富集糖肽。可针对特定糖型设计,但单一凝集素覆盖不全,常需组合使用。
- 肼化学法: 高碘酸钠氧化裂解糖链上的邻二醇结构生成醛基,醛基与固定在固相载体(如磁珠、树脂)上的酰肼基团发生共价偶联。特异性高,能捕获所有含顺式邻二醇的糖链(主要是N-糖链)。富集后,常用PNGase F酶切释放肽段进行后续分析(此时丢失糖链结构信息)或进行非特异性酶切生成糖肽(需后续质谱解析糖链)。
-
酶解:
- 通常在富集前或富集后进行。最常用胰蛋白酶(Trypsin),因其切割位点特异性高(Lys/Arg后),生成的肽段长度通常在质谱最佳检测范围内。
- 对富含脯氨酸或精氨酸/赖氨酸稀少的区域,可考虑联合使用其他蛋白酶(如Lys-C, Glu-C)。
-
质谱分析:
- 液相色谱串联质谱: 是糖肽分析的金标准平台。
- 液相色谱(LC): 通常在反相C18色谱柱上进行肽段分离。优化梯度对于分离复杂的糖肽混合物至关重要。
- 串联质谱(MS/MS):
- 数据依赖性采集: 最常见模式。在一次全扫描(MS1)后,选择强度最高的若干离子进行碎裂(如碰撞诱导解离CID、高能碰撞解离HCD、电子转移解离ETD),获得MS2谱图用于肽段序列和糖基化位点的鉴定。对于糖肽,HCD应用广泛,能同时产生肽段骨架碎片(b/y离子)和糖链特征碎片(如Y/B离子、脱水离子、交叉环碎片)。
- 数据非依赖性采集: 如SWATH, DIA。将整个质荷比范围分成若干窗口,依次对每个窗口内的所有离子进行碎裂。获得包含所有离子信息的复合MS2谱图,需借助谱图库进行解析。优点是数据完整、重现性好,但建立高质量糖肽谱图库是关键难点。
- 碎裂选择:
- HCD: 产生丰富的糖链碎片,利于糖链组成推断(单糖序列、分支信息),但可能不完全保留肽段骨架信息。
- ETD/ECD: 更倾向于保留不稳定的糖链修饰(尤其是唾液酸)和产生完整的肽段骨架碎片(c/z离子),非常适用于糖基化位点定位和磷酸化等修饰的分析。常与HCD互补使用(如ETciD, EThcD)。
- 组合策略: 同一母离子先后进行ETD和HCD碎裂,可最大化获得肽段和糖链的结构信息。
-
非标记定量分析:
- 数据提取与对齐: 利用专业生物信息学软件处理原始质谱数据。
- 肽段特征检测: 从LC-MS图谱中识别代表单个肽段离子的信号峰(其特征包括精确质荷比、保留时间、电荷态、峰面积/高度)。
- 跨样本对齐: 将不同样本中检测到的同一肽段(糖肽)的特征进行匹配和对齐,确保在不同样本间比较的是同一个分子实体。这是LFQ准确性的关键和难点。
- 定量: 通常基于MS1层面的特征强度(如色谱峰面积或峰高)。软件计算每个样本中每个对齐特征(即糖肽)的强度值。
- 归一化: 消除因样本总蛋白量上样差异、色谱或仪器性能波动等系统性偏差导致的强度差异。常用方法包括总离子强度归一化、中位数归一化或基于“管家蛋白”/“稳定蛋白”的归一化。
- 统计分析: 对归一化后的糖肽强度数据进行统计学分析(如t检验、ANOVA),以识别在不同实验条件或组别间表达量发生显著变化的糖肽(差异表达的糖肽)。
- 糖链信息处理: 在定量差异糖肽的同时,需要解读其关联的糖链组成信息(从MS/MS谱图中解析)。常见的做法是报告糖肽的“糖链组成”(Glycan Composition),即构成糖链的单糖类型和数量(如HexNAc(4)Hex(5)Fuc(1)NeuAc(2)),更高级的解析可推断部分连接信息或核心修饰信息(如核心岩藻糖基化)。
- 数据提取与对齐: 利用专业生物信息学软件处理原始质谱数据。
三、技术挑战与应对策略
-
糖肽异质性: 同一糖基化位点可连接数千种不同的糖链结构(微观不均一性),导致单个位点的糖肽种类极其繁多。
- 应对: 高分辨率、高精度质谱仪;开发更高效的富集方法以提高信噪比;结合多种碎裂模式(HCD/ETD);发展更强大的生物信息学工具处理复杂数据。
-
低丰度糖肽检测: 糖肽丰度通常远低于非修饰肽。
- 应对: 高效的富集步骤是基础;高灵敏度和高分辨率的质谱仪;优化色谱分离条件;考虑使用DIA模式提高重现性。
-
谱图解析复杂性: 糖肽的MS/MS谱图同时包含肽段骨架碎片和糖链碎片,信号复杂,自动化解析难度大。
- 应对: 开发专门针对糖肽的数据库搜索软件(如Byonic, pGlyco, MSFragger-Glyco);利用ETD/ECD辅助位点定位;构建糖肽谱图库用于DIA分析;依赖人工验证关键结果。
-
LFQ定量精密度: LFQ依赖色谱保留时间的稳定性及特征检测对齐的准确性,易受实验批次效应、仪器状态波动影响。
- 应对: 严格的实验重复(生物重复与技术重复);样本随机化处理;使用质量控制样本监控LC-MS性能;采用先进的跨批次对齐算法;应用统计方法校正批次效应。
-
糖链结构深度解析: LFQ-N糖肽分析通常能提供糖链组成信息,但难以精确解析糖苷键连接方式、分支结构、单糖异构体及修饰位置(如硫酸化位点)。
- 应对: 结合离子淌度质谱提供额外的结构分离维度;应用更先进的碎裂技术(如UVPD);离线分离糖链进行独立的MS/MS分析(如MALDI-MS/MS)。
四、重要应用领域
-
疾病生物标志物发现:
- 通过比较疾病组(如癌症、炎症、感染)与健康对照组体液(血清、血浆、尿液、脑脊液)或组织中的N-糖肽表达谱,筛选具有诊断、预后或疗效监测潜力的特异性糖基化改变。例如,肝癌、前列腺癌、乳腺癌中的血清糖蛋白糖链异常已被广泛研究。
-
宿主-病原体相互作用:
- 研究病毒(如流感病毒、HIV、新冠病毒)、细菌或寄生虫感染过程中,宿主细胞表面或分泌蛋白糖基化的动态变化,揭示病原体利用宿主糖基化机制进行入侵或免疫逃逸的策略。
-
免疫学研究:
- 分析免疫球蛋白(IgG)、细胞表面受体(如TCR, BCR, NK细胞受体)等重要免疫相关蛋白的糖基化修饰(如IgG Fc段的岩藻糖基化、半乳糖基化、唾液酸化)对免疫细胞活化、炎症反应、抗体依赖性细胞毒性(ADCC)等功能的调控作用。
-
细胞发育与分化:
- 探索干细胞分化、组织发育过程中细胞表面糖基化景观的变化,理解糖基化在细胞命运决定、细胞间识别和信号传导中的作用。
-
药物靶点与治疗反应:
- 评估靶向治疗药物(如单克隆抗体、酪氨酸激酶抑制剂)对靶蛋白或相关通路蛋白糖基化状态的影响,寻找与药物敏感性或耐药性相关的糖基化标志物。
五、展望
N-糖肽非标记定量技术为大规模、位点特异性地研究蛋白质糖基化动态提供了强有力的工具。随着质谱技术的飞速发展(更高灵敏度、分辨率、扫描速度、离子淌度分离能力)、新型富集材料的涌现以及生物信息学算法(特别是人工智能在谱图解析和定量对齐中的应用)的不断进步,该领域正朝着以下方向快速发展:
- 更高深度与覆盖度: 能够在更少量样本中检测到更多低丰度糖肽和糖基化位点。
- 更高通量: 更快地完成大规模样本队列的分析。
- 更高定量精准度与重现性: 更好地控制批次效应,提高跨实验室数据的可信度。
- 糖链结构解析更深入: 结合离子淌度、高级碎裂技术逐步实现对糖链精细结构的更全面解析(糖型水平)。
- 整合多组学分析: 将糖基化组学数据与转录组、蛋白组、磷酸化组等其他组学数据进行整合,更系统地阐述糖基化在生物过程中的调控网络和功能意义。
综上所述,N-糖肽非标记定量技术作为糖蛋白质组学研究的核心手段之一,正在深入揭示糖基化这一关键修饰在生理和病理过程中的复杂作用,为理解疾病机制、发现新型生物标志物和药物靶点开辟了广阔的前景。持续的创新将推动该技术变得更加灵敏、高效、精准和智能化。