LC/MS 非靶代谢组

发布时间:2025-06-16 08:53:32 阅读量:5 作者:生物检测中心

LC/MS非靶向代谢组学研究:全面解析生物体系的化学指纹

摘要: 非靶向代谢组学通过高效液相色谱-质谱联用技术(LC/MS),系统性分析生物样本中所有可检测的小分子代谢物(通常<1500 Da),揭示生物体在特定生理、病理或环境刺激下的整体代谢应答。该技术不预设目标,旨在全面捕捉代谢网络的动态变化,是生命科学、医学研究和环境毒理学等领域强有力的发现工具。

一、 技术核心:LC/MS的协同优势

  1. 液相色谱分离(LC):

    • 原理: 利用代谢物在固定相(色谱柱填料)和流动相(溶剂)之间分配系数的差异进行物理分离。
    • 关键作用: 降低样本复杂性,减少离子抑制作用,提高检测灵敏度与特异性。常采用反相色谱(RPLC)分离中等到非极性代谢物,亲水作用色谱(HILIC)分离极性代谢物。
    • 参数优化: 色谱柱选择(粒径、长度、填料特性)、流动相组成(水/有机溶剂比例、添加剂如甲酸/甲酸铵)、梯度洗脱程序、流速、柱温等对分离效果至关重要。
  2. 质谱检测与分析(MS):

    • 原理: 离子化后的代谢物在电场和/或磁场中根据其质荷比(m/z)进行分离和检测。
    • 离子源:
      • 电喷雾离子化(ESI): 温和,适用于极性和中等极性分子,易生成[M+H]⁺或[M-H]⁻离子。
      • 大气压化学离子化(APCI): 适用于中等极性到非极性小分子,对流动相组成和添加剂敏感性较低。
    • 质量分析器(核心):
      • 高分辨质谱(HRMS): 如飞行时间(TOF)、轨道阱(Orbitrap)、傅里叶变换离子回旋共振(FT-ICR)质谱。提供精确质量数(通常精确到小数点后4-5位),是区分同分异构体、计算元素组成、鉴定未知物的关键。
    • 扫描模式:
      • 全扫描(Full Scan): 记录选定m/z范围内所有离子的强度,用于发现和相对定量。
      • 数据依赖采集(DDA): 在Full Scan基础上,自动选择强度超过阈值的离子进行二级碎裂(MS/MS),提供结构信息。
      • 数据非依赖采集(DIA): 将整个m/z范围分成若干窗口,依次对每个窗口内所有离子进行碎裂(MS/MS),无遗漏地获取所有离子碎片信息,数据更全面但更复杂。

二、 非靶向分析流程

  1. 样本采集与制备:

    • 代表性: 快速采集(如液氮速冻)、标准化处理(血液、尿液、组织、细胞、植物、微生物等),避免代谢物降解或转化。
    • 淬灭: 立即终止酶活。
    • 提取: 选用合适溶剂(甲醇、乙腈、水及其混合液,有时含酸/碱)最大化提取不同极性的代谢物,去除蛋白质等大分子干扰。
    • 质量控制(QC): 制备混合所有样本的QC样本,在分析序列中周期性插入,用于监控系统稳定性、评估数据质量(保留时间漂移、信号强度波动、特征重现性)。
  2. LC/MS数据采集:

    • 样本和QC样本按随机顺序进样。
    • 采用优化的色谱条件和质谱参数(分辨率、扫描范围、碎裂能量等)运行。
    • 通常同时采集正离子和负离子模式数据,覆盖更广泛的代谢物。
  3. 数据处理与特征提取:

    • 原始数据转换: 将仪器原始数据转换为开放格式(如mzML)。
    • 峰检测与对齐: 识别色谱峰,将不同样本中同一代谢物对应的峰在保留时间和m/z维度上对齐。
    • 特征提取: 定义“特征”(Feature),通常由精确m/z值和保留时间(RT)唯一标识。
    • 背景扣除与噪音过滤: 去除低强度、不稳定或源于背景/溶剂的信号。
    • 关键步骤: 峰积分(计算特征强度,代表代谢物相对丰度)。缺失值填充(需谨慎处理)。
  4. 多元统计分析:

    • 无监督分析:
      • 主成分分析(PCA): 初步观察样本间整体差异、聚集趋势、离群点,评估QC样本聚集性以判断数据质量。
    • 有监督分析:
      • 偏最小二乘判别分析(PLS-DA): 寻找能最大化区分预设组别(如疾病vs对照)的变量(代谢物特征)。
      • 正交偏最小二乘判别分析(OPLS-DA): 在PLS-DA基础上分离组间差异与组内变异,模型更易解读。注意: 需严格防止过拟合(使用验证集、交叉验证、置换检验)。
    • 变量重要性: 基于上述模型(如VIP值)筛选对组间区分贡献大的特征。
  5. 代谢物鉴定:

    • 层级注释(Level 2):
      • 精确质量匹配: 将特征的精确m/z值与代谢物数据库(如HMDB, METLIN, KEGG, MassBank)中的理论质量匹配(设定合理误差容限,如5 ppm)。
      • 同位素分布: 比较实验与理论同位素丰度模式的一致性。
      • 二级质谱(MS/MS)匹配: 将实验MS/MS谱图与数据库中的参考谱图(若有)比对(光谱相似性打分,如Dot Product, Cosine Similarity)。
    • 注释置信度: 国际代谢组学学会(COSMOS)定义了不同置信度等级(Level 1:标准品确证;Level 2:上述组合;Level 3:化学类;Level 4:仅m/z)。非靶向研究大部分注释处于Level 2或3。
    • 挑战: 同分异构体区分、数据库覆盖度有限、标准谱图缺乏。
  6. 生物信息学分析与解释:

    • 差异代谢物筛选: 结合统计显著性(如p值,FDR校正)和生物学相关性(如fold change)。
    • 通路富集分析: 将差异代谢物映射到KEGG等代谢通路上,识别显著扰动的生物学通路。
    • 代谢网络分析: 研究代谢物间的相关性,构建共表达网络。
    • 生物学意义挖掘: 将代谢物变化与表型、基因表达、蛋白组学数据等关联,提出假说。

三、 核心优势

  • 全局无偏性: 无需预先假设,全面探索代谢图谱。
  • 高灵敏度和高分辨率: 检出痕量代谢物,区分结构相似物。
  • 发现驱动: 识别新的生物标志物、代谢途径或药物作用靶点。
  • 动态监测: 捕捉代谢网络对刺激的瞬时响应。

四、 面临的挑战

  • 复杂性: 样本基质复杂,代谢物理化性质差异巨大(浓度跨度大、极性范围广)。
  • 覆盖度: 单一方法难以覆盖所有代谢物(互补HILIC/RPLC, ESI/APCI, +/-模式)。
  • 离子抑制: 共洗脱物干扰目标代谢物离子化效率。
  • 代谢物鉴定: 仍是瓶颈,尤其对未知物或缺乏标准品的代谢物。
  • 数据处理: 数据量大(数千至数万特征),处理流程复杂,算法选择影响结果。
  • 标准化: 样本制备、分析流程、数据处理的标准化仍在完善中。
  • 生物学解释: 将代谢物变化转化为清晰的生物学机制需要多组学整合和深入验证。

五、 广泛应用领域

  • 疾病生物标志物发现: 癌症(如肝癌、乳腺癌早诊)、代谢性疾病(糖尿病)、神经退行性疾病(阿尔茨海默病)、心血管疾病等。
  • 药物研发: 药物作用机制(MoA)、药物毒性评价、药效生物标志物。
  • 营养学研究: 膳食干预效果评价、营养素代谢、个性化营养。
  • 植物科学: 作物抗逆性研究(干旱、盐碱)、品质改良、次生代谢物分析。
  • 微生物学: 微生物代谢、宿主-微生物互作、合成生物学。
  • 环境毒理学: 污染物暴露的生物效应与机制研究。

六、 未来展望

  • 更高性能仪器: 更快扫描速度、更高分辨率、更灵敏的质谱仪;多维分离技术(如LCxLC)。
  • 更智能的数据分析: 人工智能(AI)和机器学习(ML)应用于峰识别、代谢物鉴定、数据整合与生物学解释。
  • 改进的注释能力: 扩展代谢物数据库、共享标准谱图库、发展基于计算预测(如CFM-ID)或离子淌度(IM-MS)的鉴定新策略。
  • 标准化与规范化: 推动实验和数据报告标准(如MSI标准),促进数据共享与可重复性。
  • 空间分辨代谢组学: 结合质谱成像(MSI),在组织原位获取代谢物空间分布信息。
  • 单细胞代谢组学: 揭示细胞异质性。
  • 多组学整合: 与基因组、转录组、蛋白组、微生物组等数据深度整合,构建系统性生物学认知。

结论: LC/MS非靶向代谢组学作为强大的组学技术,能够全景式描绘生物体系的代谢状态及其动态变化。尽管在覆盖度、鉴定深度和数据分析复杂性等方面仍面临挑战,但随着技术的飞速进步、方法的标准化以及多组学整合的深入,其在精准医学、生物标志物发现、基础生命科学研究和环境健康评估等领域的潜力将得到更充分释放,持续为理解生命过程的化学本质提供关键洞见。