FF/FFPE空间转录组测序及分析

发布时间:2025-06-14 09:37:15 阅读量:5 作者:生物检测中心

FF/FFPE空间转录组测序及分析:解锁存档组织样本的空间基因表达图谱

空间转录组技术革命性地将基因表达信息锚定在组织结构的原生位置上,为理解组织微环境、细胞间相互作用及疾病发生发展提供了前所未有的视角。福尔马林固定石蜡包埋(FFPE)样本作为临床病理存档的主体形式,其空间转录组分析具有巨大的医学研究价值和转化潜力。本文系统阐述FF/FFPE样本进行空间转录组测序和分析的技术流程、难点挑战及前沿进展。

一、核心技术与工作流程

  1. 样本准备与前处理

    • FF样本: 新鲜冷冻组织,通常采用OCT包埋后切片。其RNA完整性较好,是空间转录组的理想样本。
    • FFPE样本:
      • 关键挑战: 福尔马林固定导致蛋白质-DNA/RNA交联及核酸片段化。石蜡包埋阻碍分子渗透。
      • 特殊前处理: 需进行严格的脱蜡(使用二甲苯等溶剂)和抗原修复/解交联处理(常用基于加热、酶或特定缓冲液的方法,如蛋白酶K消化或高温处理以逆转甲醛交联)。
      • 优化要点: 精确控制修复强度以平衡RNA释放与组织形态保持。需评估RNA质量(DV200值等)。
  2. 空间捕获平台选择与处理

    • 基于微阵列的平台: 主流技术采用载有带空间条形码寡核苷酸探针的芯片(如基于微珠或原位合成阵列)。探针包含:
      • 空间位置条形码 (Spatial Barcode): 唯一标识组织切片上的特定位置。
      • UMI (Unique Molecular Identifier): 校正PCR扩增偏好性和测序错误。
      • 寡聚dT序列或基因特异性探针: 捕获mRNA。
    • FFPE样本的特殊探针设计: 由于RNA高度片段化,探针设计常需覆盖更多基因区域(如更多探针对/基因),或使用随机引物而非寡聚dT捕获。
    • 组织贴合与透化: 切片贴合至芯片后,进行组织透化(常用蛋白酶),释放RNA并与下方条形码探针结合。
  3. 文库构建与测序

    • 原位逆转录: 结合的mRNA在组织原位被逆转录为带有空间条形码和UMI的cDNA。
    • cDNA释放与扩增: cDNA从组织释放后进行PCR扩增,构建测序文库。
    • 高通量测序: 通常在Illumina平台上进行短读长测序(如NovaSeq),产生包含空间条形码、UMI和转录本序列信息的reads。
  4. 生物信息学分析流程

    • 原始数据处理: 质量控制 (FastQC)、接头与低质量序列去除 (Trimmomatic, Cutadapt)。
    • 序列比对: 将reads比对至参考基因组 (STAR, HISAT2),提取包含空间条形码和UMI的序列信息。
    • 空间条形码解卷积与计数矩阵生成: 基于条形码将reads分配给组织上的特定位置(“点”或“区域”),利用UMI进行转录本分子计数校正,生成空间位置(x,y) * 基因表达量的矩阵。工具包括Space Ranger等。
    • 数据质控:
      • 每个点检测到的总UMI数、基因数(反映捕获效率)。
      • 线粒体基因占比(反映细胞活性/样本质量)。
      • 批次效应评估及校正 (如Harmony, Seurat的IntegrateData)。
      • FFPE特有:评估外源RNA对照序列检出率、特定内参基因表达完整性;更关注低丰度基因的检出。
    • 基础分析:
      • 空间基因表达可视化: 绘制特定基因或基因集在组织切片上的表达分布热图。
      • 空间聚类: 根据基因表达谱相似性识别空间上连续或离散的功能区域/细胞群落 (如BayesSpace, SpaGCN, stLearn)。
      • 差异空间表达分析: 识别在特定解剖区域、疾病区域(如肿瘤核心vs边缘)或空间聚类簇间差异表达的基因 (如SPARK, SPARK-X, DESeq2/edgeR/Limma-Voom应用于空间“点”或“区域”)。
    • 高级分析:
      • 细胞类型解卷积: 利用单细胞转录组参考数据集,推断空间位置上各细胞类型的比例 (如SPOTlight, RCTD, cell2location, Tangram)。对FFPE数据需谨慎选择兼容的参考数据集。
      • 细胞通讯分析: 基于已知配体-受体对的空间共定位模式,推测潜在的细胞间相互作用 (CellChat, CellPhoneDB)。
      • 空间轨迹推断: 分析特定细胞类型的基因表达在空间位置上的连续变化,推测分化或迁移方向 (Pyscenic, Monocle3 with spatial constraints)。
      • 多组学整合: 将空间转录组数据与H&E/IHC图像、数字病理特征、空间蛋白组数据等进行联合分析,获得更全面的空间生物学视图。
      • 空间功能富集分析: 识别空间区域特异富集的生物学通路或功能集 (如GSEA, AUCell 应用于空间区域)。

二、FFPE空间转录组的特殊挑战与应对策略

  1. RNA质量与完整性差:
    • 挑战: 片段化RNA导致全长转录本捕获困难,基因覆盖度降低,低表达基因检出受限。
    • 应对: 优化解交联方案;采用针对短片段优化的探针设计(随机引物、更多探针覆盖);深度测序;开发对片段化不敏感的分析算法(如基于外显子区域的计数);利用单细胞参考数据进行约束性解卷积。
  2. 组织异质性与渗透不均:
    • 挑战: 组织密度、固定程度差异导致透化不均,部分区域RNA释放和捕获效率低下。
    • 应对: 优化透化方案(酶浓度、时间);结合H&E图像评估捕获效率区域差异并进行数据校正(如归一化时考虑局部UMI密度);结合显微捕获激光切割(LCM)技术富集特定区域。
  3. 背景噪音与特异性降低:
    • 挑战: 固定过程可能引入非特异性结合或降解产物噪音;固定诱导的核酸损伤可能导致测序错误。
    • 应对: 设置严格阴性对照;利用UMI校正扩增噪音;应用更严格的比对和质量过滤阈值;开发针对FFPE数据优化的错误校正算法。
  4. 批次效应显著:
    • 挑战: 不同样本固定、包埋、存储条件的差异极大,导致技术性批次效应强于FF样本。
    • 应对: 实验设计时尽量标准化样本处理和建库流程;在数据分析中优先使用强力的批次效应校正方法(如Harmony, Seurat v5整合);结合ComBat等方法。

三、应用价值与前沿进展

  1. 应用价值:

    • 肿瘤研究: 解析肿瘤异质性、肿瘤微环境(TME)的空间组成与动态演变、免疫排斥/浸润模式、耐药机制、发现新的治疗靶点和生物标志物。
    • 神经科学: 绘制脑区精细结构图谱,研究神经回路、细胞类型分布、神经发育与退行性疾病的空间机制。
    • 发育生物学: 揭示胚胎发育过程中的时空基因调控网络和模式形成机制。
    • 疾病病理机制: 深入理解感染、炎症、纤维化、自身免疫病等病理过程中不同细胞类型在空间上的功能状态变化和相互作用。
    • 转化医学与临床病理: 基于丰富的临床FFPE样本库,建立空间分子分型,辅助诊断、预后预测和治疗决策(空间生物标志物)。
  2. 前沿进展:

    • 更高分辨率: 亚细胞分辨率空间转录组技术(如原位测序、MERFISH衍生技术)在FFPE样本上的应用探索。
    • 全转录组覆盖: 改进FFPE建库方法以实现更接近FF样本的全长转录本捕获。
    • 多组学空间整合: 同一张FFPE切片上同时进行空间转录组、空间蛋白组(如IMC, CODEX)、空间表观遗传组分析的技术日趋成熟。
    • 深度学习驱动: 利用深度学习直接从H&E图像预测空间基因表达或细胞类型分布;改进空间聚类和解卷积算法精度;实现高通量空间数据的自动注释。
    • 标准化与自动化: 针对FFPE样本前处理、实验和分析流程的标准化方案不断完善;自动化平台提升通量和重现性。

四、总结与展望

FF/FFPE空间转录组技术的发展,打通了连接海量临床存档样本与高维度空间分子信息的桥梁。尽管面临RNA降解、背景噪音等固有挑战,通过持续优化的样本处理、探针设计、建库测序策略以及强大的生物信息学算法(尤其是整合单细胞数据和图像信息的算法),FFPE空间转录组分析已展现出强大的应用潜力。随着分辨率提升、多组学整合能力增强以及人工智能深度赋能,该技术必将深刻革新我们对疾病生物学本质的理解,推动精准医学迈向空间精准诊疗的新时代。未来研究的重点在于进一步提升FFPE数据的质量与可靠性、建立鲁棒的分析标准和流程、深入挖掘空间信息在临床应用中的价值。

参考文献: (此处需根据具体内容添加相关学术文献,避免引用商业白皮书)