微量全转录组测序 (Smart-seq2) 检测项目详解
Smart-seq2 作为基于单细胞或微量样本的全长转录组测序技术,其核心优势在于能从极少起始量(低至单细胞或50pg总RNA)中捕获近乎完整的转录本信息。其检测项目覆盖广泛,主要包含以下核心内容:
一、基础检测项目
-
基因表达定量:
- 检测内容: 精确测量样本中每个基因的表达水平(mRNA丰度)。
- 输出形式: 基因表达矩阵(基因 x 样本),数值通常为标准化后的计数(如TPM, FPKM, RPKM)或原始UMI计数(若整合UMI)。
- 核心价值: 分析基因在不同细胞、状态或处理下的表达差异,是下游分析的基础。
-
转录本检测与定量:
- 检测内容: 识别样本中存在的所有转录本(isoform)并量化其表达量。
- 输出形式: 转录本表达矩阵(转录本 x 样本),常用TPM等指标。
- 核心价值: 揭示基因的剪接多样性,是可变剪接分析的前提。
-
可变剪接事件分析:
- 检测内容: 精确识别和量化多种类型的可变剪接事件:
- 外显子跳跃
- 内含子保留
- 可变5’/3’剪接位点
- 互斥外显子
- 输出形式: 每种剪接事件的发生率(如PSI值)或表达量比值。
- 核心价值: 理解基因功能调控的关键层面,与细胞状态、发育阶段、疾病密切相关。
- 检测内容: 精确识别和量化多种类型的可变剪接事件:
-
融合基因检测:
- 检测内容: 识别因染色体易位、缺失等产生的异常融合转录本(来自不同基因的部分序列连接)。
- 输出形式: 融合基因对列表及支持读段数、断点位置。
- 核心价值: 在癌症研究中尤为重要,是驱动突变、诊断标志物和治疗靶点。
-
等位基因特异性表达:
- 检测内容: 若样本存在杂合SNP位点,可分析来自父本和母本等位基因的表达是否平衡。
- 输出形式: ASE比值或显著性统计值。
- 核心价值: 研究基因组印记、顺式调控元件变异等机制。
-
单核苷酸变异检测:
- 检测内容: 在转录本序列中识别单核苷酸变异。
- 输出形式: SNV位点列表(位置、参考碱基、变异碱基、频率等)。
- 核心价值: 发现体细胞突变(尤其在肿瘤研究)、研究RNA编辑事件(需区分)。
-
新转录本预测:
- 检测内容: 基于测序读段组装,预测未被现有数据库注释的新转录本。
- 输出形式: 新转录本序列、结构预测及表达量。
- 核心价值: 扩展基因组注释,发现新的基因亚型或非编码RNA。
-
非编码RNA检测:
- 检测内容: 检测长链非编码RNA、环状RNA等。
- 核心价值: 研究其在调控网络中的作用。
二、核心数据特征与优势
-
全长覆盖:
- 捕获转录本5’帽到3’polyA尾的完整序列。
- 价值: 精确分析转录起始位点、剪接模式、polyA尾位置等,提供最全面的转录本视图。
-
高灵敏度:
- 能从极低起始量(单细胞、微量组织)中检测低丰度转录本。
- 价值: 适用于稀有细胞类型、微量临床样本(如穿刺活检、液体活检)分析。
-
高准确性:
- 使用oligo-dT引物起始,特异性富集带polyA尾的mRNA,减少rRNA污染。
- 整合UMI可有效校正PCR扩增偏好性和重复。
三、下游分析方向
基于上述检测项目,可进行深入数据分析:
- 差异基因/转录本表达分析: 识别不同组间显著变化的基因。
- 功能富集分析: 揭示差异表达基因涉及的生物学过程、通路及功能。
- 聚类与降维: 探索细胞/样本异质性,识别细胞亚群或状态。
- 轨迹推断: 重建细胞分化或动态过程。
- 调控网络分析: 构建共表达网络或调控网络。
- 驱动基因/通路筛选: 在疾病研究中筛选关键分子。
四、典型应用场景
- 单细胞转录组研究: 深入解析细胞异质性、发育轨迹、细胞状态转换。
- 稀有珍贵样本: 如早期胚胎、微量穿刺组织、循环肿瘤细胞、干细胞。
- 疾病机制研究: 肿瘤异质性、耐药性、免疫微环境、神经退行性疾病等。
- 生物标志物发现: 寻找诊断、预后或治疗响应的分子标志物。
- 基础研究: 基因调控、可变剪接、等位基因特异性表达等机制探索。
总结: Smart-seq2 的核心检测项目围绕基因/转录本表达定量、可变剪接分析、融合基因检测、SNV/ASE检测及新转录本发现展开。其全长覆盖和高灵敏度特性使其成为单细胞和微量样本转录组研究的强大工具,为理解细胞功能、发育和疾病机制提供全面而深入的视角。
建议: 实验设计需根据具体科学问题选择合适的样本类型、测序深度和分析策略,并严格把控实验流程(如RNA质量、建库效率)以确保数据可靠性。