iTRAQ/TMT标记定量蛋白质组学:原理、流程与应用
引言
在生命科学研究中,全面、准确地量化不同生理或病理状态下蛋白质组的动态变化至关重要。iTRAQ(Isobaric Tags for Relative and Absolute Quantitation)和TMT(Tandem Mass Tags) 技术是两种强大且广泛应用的同重同位素标记相对定量蛋白质组学策略,它们能够同时对多个样本(通常可达4-18重)进行高通量、高精度的定量比较,极大地推动了蛋白质组学的发展。
核心原理:同位素标签与报告离子
- 等重标记: iTRAQ和TMT试剂的核心设计在于其“等重性”。每个试剂分子由以下部分组成:
- 肽段反应基团: 通常是NHS-酯,特异性地与肽段N端α-氨基和赖氨酸残基的ε-氨基共价结合。
- 质量平衡基团: 这部分含有不同组合的稳定同位素(如13C, 15N, 18O)。
- 报告离子基团: 这部分也含有特定组合的稳定同位素。
- 关键点: 对于任何一套试剂(例如4-plex, 8-plex, 16-plex),完整试剂分子(标记在肽段上后)的总质量是完全相同的(等重)。
- 样品标记: 来自不同生物学样本(如对照组、处理组、不同时间点、不同组织)的蛋白质被分别提取、还原、烷基化,并酶解成肽段混合物。每个来源的肽段混合物分别用一种独特的iTRAQ或TMT试剂标记。
- 样品混合: 所有标记完成的肽段样本等量混合成一个复合样本。由于所有试剂标记后的肽段分子量相同,来自不同样本的同一肽段在质谱一级扫描(MS1)中表现为单一的、未分离的峰。 这大大简化了图谱,避免了信号分裂。
- 串联质谱(MS/MS)定量:
- 混合样本进行液相色谱-串联质谱(LC-MS/MS)分析。
- 在MS1扫描中,母离子根据其质荷比(m/z)被选择和分离。
- 选中的母离子进入碰撞池(CID, HCD等)进行碎裂。在碎裂过程中,连接报告基团与肽段其余部分的化学键优先断裂,释放出低分子量的报告离子。
- 关键定量步骤: 每种iRAQ/TMT试剂产生的报告离子具有独特的、预先设定的精确质量(例如,TMT-11 plex的报告离子质量分布在126-131 Da之间)。 在MS/MS谱图中,报告离子的丰度直接反映了其所标记肽段(进而代表原始样本中该肽段对应的蛋白质)在相应样本中的相对丰度。
- 同时,肽段主链碎裂产生b/y离子,提供肽段序列信息,用于蛋白质鉴定。
标准工作流程
- 样品制备: 蛋白质提取、定量、还原(如DTT)、烷基化(如IAM/IAA)、蛋白酶解(通常为Trypsin)。
- 肽段标记: 标记前对各组肽段进行定量(如A280),确保等量标记。标记反应通常在室温下进行一定时间,然后加入试剂终止反应(如羟胺)。
- 样本混合: 将各标记组肽段按比例混合(通常在标记后等量混合)。
- 肽段预分级(可选但强烈推荐):
- 目的: 极大降低混合样本的复杂性,提高低丰度肽段的检测深度和定量准确性。
- 方法: 常使用强阳离子交换色谱(SCX)或反相色谱(高pH RPLC)将混合肽段分成多个组分。
- LC-MS/MS分析:
- 每个预分级组分(或未分级的混合样)分别进行纳升级反相液相色谱分离(低pH RPLC)。
- 分离后的肽段在线进入高分辨率、高精度质谱仪(如Orbitrap系列、Q-TOF等)。
- 仪器设置通常采用数据依赖采集(DDA)或数据非依赖采集(DIA)模式。采用DDA时,TopN策略选择强度最高的离子进行碎裂(MS/MS)。
- MS/MS扫描需设置足够高的分辨率(如>50, 000)和扫描范围以精确分辨报告离子区域(m/z 126-131及其附近)。
- 数据分析:
- 鉴定: 使用蛋白质组学搜索引擎(如Mascot, Sequest HT, Andromeda/MSFragger)比对MS/MS谱图与蛋白质序列数据库,鉴定肽段和蛋白质。
- 定量:
- 从MS/MS谱图中提取各报告离子通道的峰强度(或峰面积)。
- 归一化: 对报告离子强度进行归一化处理,校正系统误差和上样差异(常用方法:基于所有肽段强度的全局归一化、中值归一化或基于参考通道)。
- 蛋白质定量: 通常采用同一蛋白所有特异肽段(或独特肽段)定量值的平均值或中位值作为该蛋白的相对丰度比值。比值(如处理组/对照组)大于1表示上调,小于1表示下调。
- 统计学分析: 应用t检验、ANOVA等统计方法评估差异表达的显著性(p值),并结合倍数变化(Fold Change)设定阈值筛选差异表达蛋白(DEPs)。
- 生物信息学分析: 对DEPs进行GO功能注释、KEGG通路富集分析、蛋白互作网络(PPI)分析等,挖掘生物学意义。
核心优势
- 多重能力: 同时定量最多4-18个样本,极大提高通量,减少批次效应,尤其适合时间序列、剂量效应、多组织/细胞系比较等复杂实验设计。
- 高精度(样本内): 所有样本在MS1阶段混合,后续所有处理步骤完全相同,最大限度地减少了样品制备和仪器分析的变异,提高了相对定量的精确度。
- 简化MS1谱图: 同一肽段的标记形式等重,避免了一级谱图中信号的叠加和分裂,提高了复杂样本的分析成功率。
- 相对定量范围宽: 理论上可以检测较大的丰度变化范围(通常>10倍)。
- 兼容常规蛋白质组学流程: 标记后样本处理与常规Shotgun蛋白质组学流程高度兼容。
局限性与挑战
- 报告离子信号压缩:
- 问题: 报告离子强度往往低估了实际样品间的差异倍数,导致定量比值趋于1(压缩效应)。
- 原因: 主要源于MS/MS扫描时离子阱中母离子的纯度不足(存在共洗脱、共碎裂的干扰肽段),以及碎裂效率问题。这些非目标肽段产生的背景碎片离子占据了离子阱空间或干扰报告离子检测区域,稀释或抑制了目标报告离子信号。
- 缓解措施:
- 强预分级: 降低样本复杂性是核心策略。
- 优化色谱分离: 延长色谱梯度,提高分离分辨率。
- 提高MS/MS扫描速度和分辨率。
- 使用SPS-MS3(Synchronous Precursor Selection MS3)/MSX: Orbitrap Fusion Lumos等高端仪器支持该方法。先在MS2中碎裂母离子,选择多个报告离子和肽段碎片作为母离子(SPS),再进行MS3扫描碎片化。报告离子在MS3扫描中产生,远离碎片离子区域,背景干扰大幅降低,显著提高定量准确性和动态范围。这是目前解决压缩效应的最有效手段(但牺牲扫描速度和深度)。
- 动态范围限制: 与所有基于质谱的技术一样,高丰度蛋白信号会抑制低丰度蛋白的检测和定量。
- 成本: 试剂成本相对较高(尤其高重数)。
- 数据分析复杂性: 定量数据的归一化、统计检验和生物学解释需要专业的生物信息学知识和严谨的方法。
- 样本制备变异: 尽管MS1后步骤一致,但标记前的样品处理(提取、酶解、肽段定量)差异仍会引入误差。
主要应用领域
iTRAQ/TMT技术凭借其多重定量的优势,在生物医学研究的各个领域发挥着重要作用:
- 生物标志物发现: 比较疾病组(肿瘤、神经退行性疾病、心血管疾病等)与对照组(血清/血浆、组织、尿液等样本)的蛋白质表达谱差异,筛选潜在的诊断、预后或治疗反应标志物。
- 信号通路与机制研究: 研究药物处理、基因敲除/过表达、病原体感染、环境刺激等扰动条件下细胞内信号通路的动态变化,揭示关键的调控蛋白和分子机制。
- 翻译后修饰(PTM)定量: 结合亲和富集技术(如磷酸化肽段富集、泛素化肽段富集),对蛋白的PTM修饰水平(如磷酸化、乙酰化、泛素化)进行多重定量比较,解析修饰的动态调控网络。
- 蛋白质互作组学: 应用于亲和纯化-质谱(AP-MS)实验中,同时定量比较多个诱饵蛋白(或不同条件下同一个诱饵蛋白)的互作组差异(如Pulldown-Multiplex),提高互作分析的效率和可靠性。
- 物种间比较蛋白质组学: 比较不同物种(如人、小鼠、大鼠)同源组织或细胞的蛋白质表达差异,研究进化保守性或物种特异性。
- 细胞器/亚细胞结构蛋白质组学: 对不同亚细胞组分(如线粒体、细胞核、质膜)的蛋白质组成进行多重定量分析。
- 时间进程与剂量效应研究: 追踪随时间变化或不同处理剂量下的蛋白质表达动态变化。
最新发展与展望
iRAQ/TMT技术仍在不断发展中:
- 更高重数: 不断推出更高重数的试剂(如18-plex),进一步提高通量。
- 提高准确性:
- SPS-MS3/MSX方案标准化: 成为解决压缩效应的主流方案。
- 新型试剂设计: 探索更易碎裂、报告离子质量分布更优的化学结构。
- 算法改进: 开发更精准的归一化算法、背景扣除算法和统计模型(如基于贝叶斯推断的模型)。
- 与绝对定量结合: 整合同位素标记标准肽段(iRT/KiT)或蛋白质(如QconCAT),实现绝对定量。
- 与DIA结合: 探索将多重标记技术与数据非依赖采集(DIA/SWATH)模式结合,提升数据完整性和可重现性。
- 翻译后修饰谱分析的深度化: 开发更高效的富集策略与多重标记技术的联用,实现更深入、更精准的修饰组学分析。
- 单细胞/微量样本应用: 结合超灵敏质谱技术和样品制备方法优化,努力将该技术应用于单细胞或极微量起始样本的蛋白质组分析(仍面临巨大挑战)。
结论
iTRAQ和TMT标记技术通过其独特的多重定量能力和高精度,已成为蛋白质组学研究的支柱技术之一。它们在揭示复杂生物过程的分子机制、发现疾病标志物、解析信号网络等方面提供了强大的工具。尽管存在报告离子压缩等挑战,但随着色谱分离技术、质谱硬件(特别是SPS-MS3的实现)和生物信息学分析方法的持续进步,该技术的准确性、深度和应用范围将不断拓展,继续为探索生命活动的复杂性做出重要贡献。