非靶代谢组学:揭秘生物体系的全面代谢指纹图谱(检测项目深度解析)
非靶向代谢组学是生命科学研究中强大的探索性工具,其核心在于无偏向性地、尽可能广泛地检测和相对定量生物样本(如血液、尿液、组织、细胞、植物提取物等)中所有可检测到的小分子代谢物。与靶向代谢组学针对特定化合物不同,非靶向方法旨在绘制尽可能完整的代谢图谱,发现新的生物标志物或揭示未知的代谢通路变化。其检测项目的核心就是**“样本中所有可检测到的代谢物”**。
以下是对非靶代谢组学检测项目的详细解析:
一、 检测对象:小分子代谢物的广阔世界
非靶代谢组学检测的目标是生物体内所有分子量相对较小(通常在50-1500 Da范围内)的代谢物。这些代谢物是生物体生命活动的直接产物和参与者,其种类极其繁多且动态变化。主要类别包括但不限于:
- 氨基酸及其衍生物: 蛋白质合成基础、信号分子前体等。
- 示例: 甘氨酸、谷氨酸、色氨酸、牛磺酸、γ-氨基丁酸等。
- 有机酸: 能量代谢(如三羧酸循环)、脂肪酸代谢等途径的中间产物或终产物。
- 示例: 柠檬酸、琥珀酸、乳酸、丙酮酸、酮体等。
- 糖类及其代谢物: 能量来源、结构成分。
- 示例: 葡萄糖、果糖、蔗糖、糖酵解和三羧酸循环中间体等。
- 脂质: 细胞膜结构、能量储存、信号传导分子。
- 子类繁多: 脂肪酸、甘油三酯、甘油二酯、甘油一酯、磷脂、鞘脂、固醇类等。脂质组学常作为非靶代谢组学的子集或关联分析。
- 核苷酸及其衍生物: 遗传信息载体、能量货币、信号分子。
- 示例: ATP、ADP、AMP、cAMP、核苷、核苷酸等。
- 维生素及辅酶: 酶促反应的辅助因子。
- 植物次生代谢物: 在植物中尤为丰富,如生物碱、黄酮类、萜类、酚酸等,具有防御、信号、色素等多种功能。
- 外源性物质及其代谢产物: 药物、环境污染物、毒素、膳食成分等在体内的转化产物。
- 未知或未注释的代谢物: 这是非靶向方法的重要价值所在——发现生物学数据库中尚未收录的新化合物或已知化合物的新存在形式(如异构体)。
核心特点:
- 无偏向性: 理论上对所有符合检测条件的代谢物都进行检测,不预先设定目标列表。
- 覆盖广: 旨在尽可能多地覆盖不同化学类别的代谢物。
- 相对定量: 主要提供不同样本间代谢物丰度的相对变化(如实验组 vs 对照组),而非绝对浓度(绝对定量需要标准品和靶向方法)。
- 发现驱动: 核心目标是发现差异表达的代谢物,为后续机制研究提供线索和假设。
二、 检测平台:技术核心
非靶代谢组学检测主要依赖高分辨率质谱,通常与色谱分离技术联用以降低样本复杂性、提高检测灵敏度和分辨率。
-
主流联用技术:
- 液相色谱-质谱联用:
- 色谱: 反相液相色谱、亲水相互作用色谱、离子对色谱等。用于根据代谢物的极性、亲水性等物理化学性质进行分离。
- 质谱: 高分辨率、高质量精度质谱仪是核心。
- 飞行时间质谱: 扫描速度快、质量范围宽、分辨率高。
- 轨道阱质谱: 超高分辨率、高质量精度,非常适合复杂基质中代谢物的精准鉴定。
- 四极杆-飞行时间质谱: 结合了四极杆的选择性和TOF的高分辨率/高质量精度。
- 气相色谱-质谱联用:
- 色谱: 气相色谱。适用于挥发性或经过衍生化后可挥发的小分子代谢物(如有机酸、部分氨基酸、糖类、脂肪酸等)。
- 质谱: 常使用电子轰击离子源的质谱(如四极杆或TOF),数据库匹配成熟。
- 毛细管电泳-质谱联用: 对极性/带电代谢物(如氨基酸、核苷酸)有独特优势。
- 液相色谱-质谱联用:
-
质谱扫描模式:
- 全扫描: 最常用模式(如MS1或Full Scan)。记录在设定质量范围内所有离子的质荷比和强度信息。是获得全局代谢图谱的基础。
- 数据依赖采集: 在获得一级质谱(MS1)信息的同时,自动选择强度较高的离子进行碎裂,获得二级质谱图(MS2),为代谢物结构鉴定提供关键碎片信息。
- 数据非依赖采集: 系统性地对所有离子或按固定间隔的离子进行碎裂,获得更全面的MS2信息,减少因离子选择带来的偏向性,但数据量巨大。
三、 检测流程:从样本到数据
-
样本前处理:
- 采集与保存: 严格按照标准操作程序进行,快速冷冻(液氮)或使用稳定剂,防止代谢物降解或转化。
- 提取: 使用合适的溶剂(甲醇、乙腈、水及其混合液,有时含酸/碱)破坏细胞/组织,尽可能多地溶解不同极性的代谢物。常用方法有液液萃取、固相萃取等。目标是最大化代谢物的提取覆盖率和稳定性,同时最小化干扰物和基质效应。
- 净化与浓缩: 去除蛋白质、脂质等大分子干扰物,有时需要浓缩样本。
- 衍生化: 对GC-MS分析,常需对代谢物进行化学衍生化以提高其挥发性和检测灵敏度。
-
色谱分离:
- 将提取液注入色谱系统。
- 代谢物在色谱柱中基于其物理化学性质(极性、亲水性、离子性等)被分离,形成不同的洗脱峰。这大大降低了进入质谱的基质复杂性,减少了离子抑制效应。
-
质谱检测:
- 从色谱柱洗脱出的代谢物依次进入质谱离子源(如电喷雾离子化、大气压化学离子化)。
- 代谢物在离子源中被电离,通常形成带正电荷或负电荷的离子。
- 离子根据其质荷比在质量分析器中被分离和检测。
- 检测器记录每个离子的质荷比和强度(丰度),形成质谱图。整个色谱分离过程中持续扫描,得到包含保留时间、质荷比和丰度信息的三维数据集。
-
数据采集质量控制:
- 在分析序列中插入QC样本至关重要:
- 混合QC: 由所有待测样本等量混合制成。用于监控整个分析过程的稳定性和重现性。
- 空白QC: 不含样本的溶剂。用于评估背景污染和系统残留。
- 标准品QC: 含有已知浓度代谢物的样本。用于评估系统性能(灵敏度、线性等)。
- QC样本通常在整个批次分析中按固定间隔(如每10个样本)运行,用于评估仪器稳定性、信号漂移、保留时间偏移等。
- 在分析序列中插入QC样本至关重要:
四、 检测结果:原始数据与特征
- 原始数据文件: 包含每个样本的所有原始质谱图信息(保留时间、质荷比、离子强度)。
- 代谢物特征: 经过数据处理软件(如XCMS, MZmine, Progenesis QI, Compound Discoverer等)进行峰提取、对齐、积分后,每个被检测到的离子峰被定义为一个“特征”。一个特征通常包含以下关键信息:
- 精确质量: 代谢物离子的精确质荷比(m/z)。
- 保留时间: 该代谢物在色谱柱中的洗脱时间。
- 峰面积/峰高: 反映该离子在样本中的相对丰度。
- MS/MS谱图: 如果采用DDA或DIA模式,每个特征还关联其碎片离子谱图。
- 特征矩阵: 最终数据通常是一个矩阵,行代表检测到的所有代谢物特征(可能成千上万),列代表不同样本,矩阵中的值代表该特征在该样本中的相对丰度(如峰面积)。
五、 检测的局限性与挑战
- 覆盖度限制: 没有一种方法能检测到生物体内所有的代谢物。受限于提取效率、色谱兼容性、离子化效率、检测灵敏度等,总有一部分代谢物无法被有效检测到。
- 基质效应: 复杂生物基质中的共存物质可能抑制或增强目标代谢物的离子化效率,影响定量准确性。
- 灵敏度差异: 不同代谢物的检测灵敏度差异巨大,低丰度代谢物可能被高丰度代谢物掩盖。
- 代谢物鉴定: 这是非靶代谢组学最大的挑战之一。根据精确质量、保留时间、MS/MS谱图与数据库比对进行鉴定。但存在:
- 同分异构体区分困难: 许多代谢物具有相同的分子式和精确质量,但结构不同(异构体),仅凭常规LC-MS/MS难以区分。
- 数据库不完善: 已知代谢物的数据库仍在建设中,许多代谢物特别是新化合物或物种特异性化合物缺乏参考谱图。
- 鉴定置信度分级: 鉴定结果通常需要分级(如Level 1:标准品确证;Level 2:基于MS/MS谱图匹配;Level 3:基于精确质量匹配;Level 4:仅保留时间或质荷比匹配)。
- 相对定量: 非靶方法提供的是相对丰度变化,而非绝对浓度。跨批次比较可能更复杂。
- 数据复杂性: 产生海量、高维数据,需要专业的生物信息学工具和统计学方法进行分析。
六、 总结:检测项目的核心价值
非靶代谢组学的检测项目,本质上是利用先进的分离技术与高分辨质谱,对生物样本进行全局性、无偏向性的小分子代谢物扫描和相对定量分析。其核心价值在于:
- 发现未知: 是发现新型代谢物、新型生物标志物(疾病诊断、预后、疗效评估)、新型代谢通路或调控机制的最有力工具。
- 系统视角: 提供生物体在特定生理、病理或环境条件下整体代谢状态的“快照”,反映系统水平的生物学变化。
- 假设生成: 通过揭示显著的代谢变化,为后续靶向验证和深入的分子机制研究指明方向。
因此,非靶代谢组学的“检测项目”并非一个固定的列表,而是一个旨在最大限度揭示样本中小分子代谢物组成和变化的动态探索过程。其成功高度依赖于优化的实验设计、严谨的样品处理、先进的分析平台、严格的质量控制以及专业的生物信息学分析和代谢物注释能力。它开启了理解生命复杂代谢网络的大门,是精准医学、药物研发、营养科学、环境毒理学、植物科学等领域不可或缺的利器。