FFPE单细胞转录组测序

发布时间:2025-06-03 18:27:22 阅读量:8 作者:生物检测中心

标题:解锁存档宝藏:FFPE单细胞转录组测序的检测项目与技术解析

摘要: 福尔马林固定石蜡包埋 (FFPE) 样本是临床和研究中宝贵的存档资源,蕴含丰富的生物学和病理学信息。然而,其RNA的高度片段化和交联特性,使得对其进行高质量的单细胞转录组测序 (scRNA-seq) 极具挑战。近年来,随着技术的突破,FFPE单细胞转录组测序已成为现实,为利用海量存档样本进行回顾性研究打开了大门。本文重点阐述FFPE单细胞转录组测序的核心检测项目、关键技术环节、应用价值及面临的挑战。

引言: 单细胞转录组测序革命性地改变了我们对细胞异质性、发育轨迹和疾病机制的理解。传统上,scRNA-seq主要依赖于新鲜或速冻的组织样本,以获得高质量的完整RNA。相比之下,FFPE样本是临床病理诊断和生物样本库的基石,数量庞大且通常具有长期随访的临床数据。将scRNA-seq技术应用于FFPE样本,意味着能将单细胞分辨率的分子图谱与宝贵的临床病理信息、长期预后以及治疗反应关联起来,具有巨大的转化医学潜力。然而,FFPE处理过程(福尔马林固定导致核酸-蛋白交联,石蜡包埋导致脱水)会严重破坏RNA的完整性和可及性,是技术应用的主要瓶颈。本文将深入探讨克服这些挑战的关键检测项目和技术策略。

核心检测项目与流程详解:

FFPE单细胞转录组测序是一个多步骤的复杂流程,每个环节都针对FFPE样本的特性进行了优化。以下是核心检测项目:

  1. 样本评估与选择:

    • 检测目标: 评估FFPE样本中RNA的质量、数量和片段化程度,筛选出适合进行scRNA-seq的样本。
    • 关键指标:
      • RNA总量 (Total RNA Yield): 通常使用荧光定量法(如Qubit)或分光光度法(如Nanodrop)测量。FFPE样本RNA总量通常较低且变异大。
      • RNA完整性: 由于FFPE RNA高度片段化,传统的RNA完整性数值 (RIN) 或RNA质量数值 (RQN) 不再适用(通常<3)。取而代之的是评估大于200 nt的RNA片段比例 (DV200) 或使用片段分析仪 (Fragment Analyzer/Bioanalyzer) 检查片段分布模式。DV200 > 30% 通常被认为是进行后续单细胞实验的最低门槛,越高越好。
      • 目标基因表达 (可选): 通过qRT-PCR检测少量管家基因或感兴趣的目标基因,评估其可扩增性。
    • 意义: 严格筛选是实验成功的第一步,避免在低质量样本上浪费资源。
  2. 组织解离与单细胞悬液制备:

    • 检测目标: 将FFPE组织块有效解离成高质量的、包含完整有核细胞的单细胞悬液,同时最大化保护残留的RNA。
    • 关键技术:
      • 脱蜡与复水: 使用二甲苯等溶剂去除石蜡,再通过梯度乙醇进行复水。
      • 抗原修复 (可选但常用): 使用热诱导表位修复 (HIER) 或酶法修复,逆转福尔马林引起的交联,提高RNA的可及性和细胞膜/核膜的通透性。常用缓冲液如Tris-EDTA (pH 9.0) 或柠檬酸盐 (pH 6.0)。优化修复条件(时间、温度、pH)至关重要,需平衡交联逆转与RNA降解风险。
      • 酶解与机械解离: 使用蛋白酶(如蛋白酶K、胶原酶、dispase等)消化细胞外基质,结合精细的机械研磨或切碎(如gentleMACS™ Dissociator)。酶解时间、浓度和温度需要根据组织类型严格优化(通常比新鲜组织更长)。
      • 细胞核分离 (常用替代方案): 由于FFPE样本中细胞质RNA损失严重且细胞膜易碎,分离细胞核进行核转录组测序 (snRNA-seq) 是更可靠、更常用的策略。利用裂解缓冲液(含去垢剂)裂解细胞质,通过密度梯度离心(如蔗糖、碘克沙醇)或基于微流控的细胞核分选纯化出完整细胞核。
      • 去除碎片与死细胞: 使用密度梯度离心(如Percoll)或死细胞去除磁珠试剂盒,清除解离过程中产生的碎片和死细胞/核,提高活细胞/核比例。
      • 细胞/核计数与活力评估: 使用台盼蓝、AO/PI染料染色或自动细胞计数器(如Countess II)结合荧光染料(如DAPI、SYTO染料)评估细胞/核浓度、大小和活力(活细胞/核比例)。高活率(>70%)是保证数据质量的关键
    • 意义: 这是整个流程中最关键也最具挑战性的环节之一,直接影响单细胞捕获效率和后续数据质量。
  3. 单细胞捕获与文库构建:

    • 检测目标: 高效捕获单个细胞/核,并构建可进行高通量测序的cDNA文库。
    • 主流平台与技术: 基于微流控液滴的10x Genomics Chromium平台是目前最广泛用于FFPE样本(尤其是snRNA-seq)的商业化平台。其核心是基于3’端或5’端捕获
    • 关键技术考量 (针对FFPE):
      • 片段化RNA兼容性: 平台使用的寡核苷酸引物设计需适应捕获短片段RNA。
      • 模板转换与预扩增: 高效的模板转换反应 (Template Switching, 用于基于MMLV RT的平台如10x) 和稳健的预扩增 (PCR) 对于从FFPE样本中低丰度、受损的RNA中获取足够量的cDNA至关重要。需要优化反应条件以降低扩增偏好性和重复率
      • 唯一分子标识符 (UMI): 使用UMI标记每个原始转录本分子,用于校正PCR扩增偏差和估算转录本绝对丰度,这对FFPE数据尤其重要。
      • cDNA片段化与文库构建: 将预扩增后的全长cDNA进行片段化(通常使用酶切或物理打断),然后添加测序接头,构建成最终的测序文库。
      • 文库质量控制: 使用Qubit测量文库浓度,使用Bioanalyzer或Fragment Analyzer检查文库片段大小分布(通常在300-1000 bp范围),并通过qPCR (如KAPA Library Quant Kit) 精确定量文库浓度以确保测序通量合理。
    • 意义: 该步骤将单个细胞的转录组信息转化为可被高通量测序仪识别的DNA文库。
  4. 高通量测序:

    • 检测目标: 对构建好的单细胞文库进行深度测序,获取每个细胞的基因表达谱。
    • 平台: 主要使用Illumina NovaSeq, NextSeq或HiSeq等高通量测序仪。
    • 测序策略:
      • 读长: 通常采用双端测序 (Paired-End, PE),如PE150 (2x150 bp),足以覆盖大部分短片段cDNA和UMI/细胞条形码信息。
      • 测序深度: FFPE样本通常需要比新鲜/冻存样本更高的测序深度(例如,平均每个细胞核50,000-100,000 reads或更多),以补偿RNA的片段化、降解导致的低捕获效率和基因检出率。具体深度取决于研究目标(如是否侧重稀有细胞类型、低表达基因)。
    • 意义: 产生原始测序数据 (FASTQ文件)。
  5. 生物信息学分析:

    • 检测目标: 从原始测序数据中提取、处理、分析单细胞水平的基因表达信息,揭示细胞异质性、状态和功能。
    • 核心分析步骤:
      • 原始数据处理: 使用平台配套工具(如Cell Ranger for 10x Genomics)或通用工具(如STARsolo, kallisto|bustools)进行:
        • 解复用 (Demultiplexing):根据文库索引区分不同样本。
        • 细胞/核条形码和UMI提取:识别reads所属的细胞/核及对应的转录本分子。
        • 序列比对:将reads比对到参考基因组。
        • 基因定量:生成每个细胞/核的基因表达矩阵(行:基因,列:细胞/核,值:UMI计数)。
      • 数据质控 (QC) 与过滤:
        • 关键质控指标:
          • 每个细胞的测序reads数
          • 每个细胞检测到的唯一基因数 (nGene/ nFeatures)
          • 每个细胞的UMI总数 (nCount)
          • 线粒体基因比例 (%MT): FFPE样本中可能较高,但阈值设定需谨慎(可能比新鲜样本宽松)。
          • 核糖体基因比例 (%Ribo)
          • 双联体 (Doublet) 识别与去除: 使用如Scrublet, DoubletFinder等工具识别并去除可能由两个或多个细胞/核共包裹形成的假“细胞”。
        • 过滤标准: 根据样本和实验情况设定阈值,去除低质量细胞/核(如nGene过低)、高%MT细胞(可能代表死细胞/核)、高%Ribo细胞以及预测的双联体。
      • 数据标准化与降维:
        • 标准化: 消除技术噪音(如测序深度差异),常用方法如LogNormalize (Seurat), SCTransform, or scran。
        • 高变基因筛选: 选择表达变异系数高的基因用于下游分析。
        • 降维: 主成分分析 (PCA), t-分布随机邻域嵌入 (t-SNE), 或均匀流形近似与投影 (UMAP)。
      • 细胞聚类与注释:
        • 聚类: 基于降维空间中的距离(如PCA主成分),使用图聚类算法(如Louvain, Leiden)识别细胞群。
        • 注释: 利用已知细胞类型标记基因的表达谱,结合数据库(如CellMarker, PanglaoDB)或参考数据集,对每个细胞簇进行生物学注释(细胞类型、状态)。
      • 差异表达分析: 比较不同组别(如疾病vs对照,不同处理)或不同细胞类型/状态间的基因表达差异。
      • 轨迹推断: 分析发育或动态过程中细胞的连续状态变化(如伪时序分析,使用Monocle3, Slingshot等)。
      • 细胞间通讯分析: 预测不同细胞类型之间潜在的配体-受体相互作用(如CellChat, CellPhoneDB)。
    • 意义: 将海量的原始测序数据转化为有生物学意义的见解,是FFPE sc/snRNA-seq研究的核心产出阶段。

应用价值:

  • 回顾性临床研究: 利用大型FFPE样本库(如癌症组织芯片、临床队列存档)研究疾病(尤其是癌症)的分子异质性、预后标志物、治疗反应/耐药机制、肿瘤微环境演变,无需等待新样本收集。
  • 空间转录组整合: FFPE切片是空间转录组技术(如Visium, Xenium, MERFISH)的理想样本。结合sc/snRNA-seq数据,可在单细胞/亚细胞分辨率下解析基因表达的空间位置信息。
  • 发育与疾病进程研究: 研究发育过程中或疾病(如神经退行性疾病)进程中细胞组成和分子特征的变化。
  • 罕见细胞类型鉴定: 在复杂组织中识别和表征稀有细胞群体(如肿瘤干细胞、特定免疫细胞亚群)。
  • 药物靶点发现与验证: 在存档的临床样本中验证药物靶点的表达模式及其与疗效的关系。

挑战与展望:

  • RNA质量限制: 即使经过优化,FFPE样本的RNA质量和完整性仍显著低于新鲜/冻存样本,导致基因检出率低、检测偏向高表达基因、难以分析长转录本或可变剪切。
  • 批次效应: FFPE样本的固定、包埋、储存时间和条件差异大,容易引入显著的批次效应,需在实验设计(平衡)和数据分析(校正)中特别注意。
  • 解离效率与代表性: 解离过程可能对某些脆弱细胞类型造成选择性丢失,影响细胞群体组成的真实性(尤其细胞质解离时)。细胞核测序虽更稳健,但丢失了部分重要的细胞质RNA信息。
  • 成本与通量: 目前FFPE sc/snRNA-seq的成本仍然较高,通量相对较低(尽管在提升)。
  • 标准化: 不同实验室间在样本处理、解离、建库方法上的差异,需要更完善的标准化流程和质控指标以确保结果的可比性和可重复性。
  • 数据分析复杂性: FFPE数据特有的噪音和偏差,要求开发更专门化的生物信息学工具和过滤标准。

结论:

FFPE单细胞(核)转录组测序技术已成功跨越了重大技术障碍,使得利用海量存档FFPE样本在单细胞分辨率上进行回顾性分子研究成为可能。其核心检测项目——从严格的样本筛选、优化的解离与细胞/核分离、到针对FFPE RNA特性的文库构建、深度测序以及复杂的数据分析——构成了一套完整且仍在不断完善的解决方案。尽管仍面临RNA质量、批次效应等挑战,该技术的强大应用价值,尤其是在临床转化研究和空间多组学整合方面,已经得到充分展现。随着技术的持续优化、成本的降低和分析方法的进步,FFPE单细胞转录组测序必将成为解锁人类疾病分子机制和推动精准医疗发展的关键工具。