细胞单细胞测序实验 - 中析研究所生物检测中心

单细胞测序实验技术全流程详解

摘要： 单细胞测序技术革命性地改变了生命科学研究，使科学家能够在单个细胞分辨率水平解析组织异质性、追踪细胞发育轨迹、揭示稀有细胞类型及功能状态。本文系统阐述单细胞转录组测序实验的标准流程、关键技术环节、数据分析要点与应用挑战，为研究者提供全面参考。

一、实验核心流程

样本制备与解离
- 样本来源： 新鲜组织、培养细胞、冻存组织（需特定复苏方案）、体液（如血液、脑脊液）。
- 目标： 获得高活性、高完整性的单细胞悬液。
- 步骤：
  - 组织处理： 快速取材、清洗去除杂质。
  - 机械解离： 切碎、研磨或温和剪切。
  - 酶消化： 选择合适的酶（如胶原酶、胰蛋白酶、木瓜蛋白酶）和消化条件（时间、温度、浓度）高效解离组织，同时最大限度保护细胞膜完整性与RNA。
  - 过滤与洗涤： 依次通过不同孔径（如40μm、70μm）滤网去除细胞团块和碎片；用含蛋白缓冲液（如含牛血清白蛋白的磷酸盐缓冲液）洗涤去除酶和死亡细胞碎片。
  - 红细胞裂解（如需要）： 针对含血细胞样本。
  - 细胞计数与活性检测： 使用自动细胞计数仪或血球计数板结合台盼蓝（Trypan Blue）或碘化丙啶（Propidium Iodide）染色评估存活率（通常要求>80%）。
  - 细胞浓度调整： 调整至目标平台所需浓度范围。
单细胞分离与条形码标记
- 核心原理： 物理分隔单个细胞，同时为每个细胞的核酸赋予唯一的分子标记序列。
- 主流技术平台：
  - 微流控液滴法： 将单个细胞与携带条形码微珠（通常包裹在油滴中）配对。微珠上含有寡核苷酸序列，包含：细胞条形码、唯一分子标识符、寡聚dT引物（用于捕获mRNA）和测序接头。此方法通量最高。
  - 微孔板法： 将单个细胞分配到微孔板的独立反应孔中，每孔预先加入或后续加入包含细胞条形码的引物/转座酶复合物。通量较低但灵活性高。
  - 流式分选法： 利用流式细胞仪分选单个细胞至微孔板中，后续进行独立的逆转录和文库构建。
- 关键点： 优化细胞悬液浓度是降低双胞率的关键。
文库构建
- 原位裂解与反转录： 单个细胞被裂解释放RNA，通过微珠或孔内引物上的寡聚dT片段捕获带有多聚腺苷酸尾的mRNA分子并进行逆转录合成第一链cDNA。
- 第二链合成与扩增： 合成第二链cDNA，并进行PCR扩增以增加cDNA量。
- 片段化与末端修复： 将cDNA片段化至合适长度，并进行末端修复使其末端平整。
- 测序接头连接： 在cDNA片段两端连接测序所需的通用接头序列。
- 文库扩增与纯化： 进行最后的PCR扩增富集文库，并使用磁珠纯化去除杂质。
- 质量控制： 使用生物分析仪、荧光定量仪评估文库浓度、片段大小分布（理想主峰在预期长度，如~400-600 bp）和完整性。
高通量测序
- 平台选择： 主要使用短读长高通量测序仪。
- 测序策略： 通常采用双端测序。
  - Read 1： 读取细胞条形码和UMI（通常50-100bp）。
  - Read 2： 读取插入的cDNA片段序列（通常90-150bp）。
  - Index Read： 读取样本索引（适用于多路复用）。
- 测序深度： 取决于研究目标和细胞类型复杂度，通常建议平均每个细胞覆盖数万到数十万条reads。

二、数据分析核心步骤

原始数据处理
- 数据解复用： 根据样本索引序列将混合测序的数据分配到对应的样本。
- 质量评估： 使用工具检查reads质量分数、碱基分布、接头污染等。
- 接头与低质量碱基去除： 去除测序接头和低质量reads/碱基。
序列比对与定量
- 比对： 使用专用比对工具将处理后的Read 2序列精确比对到参考基因组或转录组。
- 细胞条形码与UMI提取： 从Read 1中准确提取细胞条形码和UMI。
- 定量： 根据唯一匹配的比对位置，并结合细胞条形码（归属到细胞）和UMI（去除PCR重复），生成每个细胞中每个基因的分子计数表达矩阵（cells × genes）。
质量控制与细胞过滤
- 关键指标：
  - 每个细胞的检测基因数： 过滤检测基因过少的细胞（可能为空滴或低质量/濒死细胞）。
  - 每个细胞的UMI总数： 过滤UMI总数过低或过高的细胞（过低：空滴；过高：双胞或多胞）。
  - 线粒体基因占比： 高占比（>10-20%）常指示膜损伤的细胞质泄漏或凋亡细胞。
  - 核糖体基因占比（可选）： 异常高占比可能提示特定状态。
- 方法： 通过可视化（如小提琴图）设定阈值或使用统计模型自动过滤低质量细胞。
数据标准化与批次校正
- 标准化： 消除因测序深度差异造成的技术偏差（常用方法如：LogNormalize， sctransform）。
- 高变基因筛选： 识别在细胞间表达方差较高的基因用于下游降维聚类。
- 批次效应校正（如有多批次数据）： 使用整合工具消除因样本制备时间、测序批次等非生物因素导致的系统性差异。
降维与聚类
- 降维： 主成分分析提取数据主要变异方向。
- 非线性降维可视化： t-SNE或UMAP在二维/三维空间展示细胞关系。
- 细胞聚类： 基于降维后数据进行聚类，识别转录组相似的细胞群体（常用方法如：Louvain， Leiden）。需要优化分辨率参数。
细胞类型注释
- 核心步骤： 为每个聚类簇推断生物学身份。
- 方法：
  - 已知Marker基因： 查找文献报道的细胞类型特异基因。
  - 差异表达分析： 找出每个簇显著高表达的基因。
  - 参考数据库映射： 利用公开单细胞参考图谱或算法进行自动/半自动注释。
  - 功能富集分析： 分析基因集功能。
高级分析
- 伪时间分析： 推断细胞分化或激活的动态轨迹。
- 细胞通讯分析： 预测不同细胞类型间的配体-受体相互作用。
- 转录因子调控分析： 推断调控细胞状态的关键转录因子。
- 亚群精细化分析： 对特定细胞类型进行再分群和深入分析。
- 整合多组学数据： CITE-seq（蛋白）， ATAC-seq（染色质可及性）等。

三、关键挑战与注意事项

实验层面：
- 高质量单细胞悬液： 细胞活力和解离效率是成功基石。
- 低双胞率/多胞率： 优化细胞浓度至关重要。
- 批次效应： 尽量统一实验操作（人员、试剂批次、时间）；设计时考虑批次混杂因素。
- RNA降解： 快速处理样本，使用RNase抑制剂。
- 稀有细胞捕获： 需富集足够起始细胞数或使用针对性策略。
- 成本： 仍是限制大规模应用的因素。
数据分析层面：
- 数据稀疏性： 需采用专门处理缺失值的方法。
- 批次效应校正： 方法仍在发展中，需谨慎选择和验证。
- 聚类分辨率选择: 主观性较强，需结合生物学知识和多次尝试。
- 细胞注释准确性： 高度依赖先验知识和Marker基因可靠性。
- 计算资源： 大规模数据分析需高性能计算环境。
- 分析方法标准化： 流程和参数选择需透明化和可复现。

四、应用前景

单细胞技术正深度推动生命科学变革：

绘制高分辨率细胞图谱： 构建器官、胚胎发育、疾病组织的精细图谱。
解析发育与分化： 揭示细胞命运决定机制。
肿瘤异质性研究： 鉴定肿瘤干细胞、克隆进化、耐药机制、微环境互作。
免疫学研究： 精细解析免疫细胞多样性、功能状态、应答机制。
神经科学： 探索大脑复杂细胞类型与神经回路。
疾病机制与诊断： 发现新的疾病相关细胞状态、生物标志物和治疗靶点。
药物研发： 评估药物在异质细胞群体中的差异效应。

结论：

单细胞测序技术作为一项强大的工具，为理解生命的细胞基础提供了前所未有的视角。随着实验方法的不断优化、通量和多组学整合能力的提升、数据分析算法的发展和成本的降低，该技术将在基础生物学研究、精准医学和药物开发等领域发挥越来越重要的作用。然而，实验标准化、数据分析挑战和生物学意义的深入挖掘仍是未来研究的重点方向。研究者需深刻理解技术原理、优缺点及关键环节，严谨设计实验，合理选用分析方法，方能充分挖掘单细胞数据的价值，推动科学发现。

单细胞测序实验技术全流程详解

一、 实验核心流程

二、 数据分析核心步骤

三、 关键挑战与注意事项

四、 应用前景

一、实验核心流程

二、数据分析核心步骤

三、关键挑战与注意事项

四、应用前景