靶向捕获测序

发布时间:2025-06-24 08:51:39 阅读量:1 作者:生物检测中心

靶向捕获测序:深度解析目标基因组的利器

靶向捕获测序(Targeted Capture Sequencing)是现代基因组学研究与精准医疗中不可或缺的核心技术。它通过特异性富集目标基因组区域,实现对特定基因、外显子组或功能区域的深度、高效测序,显著降低了全基因组测序的成本与复杂性,为遗传病诊断、肿瘤研究、药物基因组学等应用开辟了广阔前景。

一、技术原理与核心流程

靶向捕获测序的核心在于利用设计精密的核酸探针(探针),通过碱基互补配对原则,特异性“钩取”(捕获)样本DNA文库中预先设定的目标片段。其基本流程如下图所示:

流程图: [样本DNA] --> [DNA片段化 & 末端修复] --> [接头连接,构建文库] | V [文库与探针混合杂交] | V [磁珠/链霉亲和素富集捕获复合物] --> [洗去非特异结合] | V [洗脱捕获的目标DNA片段] | V [PCR扩增富集] | V [高通量测序 & 数据分析]
  1. 文库构建(Library Preparation):

    • 样本DNA(基因组DNA、FFPE样本DNA等)被物理或酶法片段化至所需大小(通常200-500bp)。
    • 片段末端进行修复,使其成为平末端。
    • 在片段两端连接特定的测序接头(Adapter)。这些接头包含后续PCR扩增和测序仪识别的必需序列,以及用于区分不同样本的索引序列(Barcode)。
  2. 杂交捕获(Hybridization Capture):

    • 构建好的DNA文库与大量预先设计合成的核酸探针混合。
    • 在严格控制温度、盐浓度、时间等条件的杂交体系中,探针通过碱基互补配对,特异性地与文库中对应的目标DNA区域结合,形成探针-DNA杂交双链。这一步是整个技术的特异性来源和关键所在。
    • 探针类型: 根据目标区域大小和设计灵活度,主要分两类:
      • 液相芯片探针(液相探针): 长度约120bp的合成寡核苷酸探针,通常带有生物素标记。探针池可灵活设计,覆盖任意指定的基因组区域(如特定基因、通路基因集、自定义区域)。
      • 固相芯片探针: 探针固定在固相载体(如芯片)表面。文库在芯片上流动进行杂交捕获。
  3. 捕获复合物富集与清洗(Enrichment & Washing):

    • 液相捕获: 利用标记在探针上的生物素(Biotin)与固定在磁珠上的链霉亲和素(Streptavidin)间的强亲和力,通过磁力分离,将探针-目标DNA复合物从溶液中特异性地吸附到磁珠上。随后进行严格的清洗步骤,洗去未杂交或非特异性结合的DNA片段(即非目标DNA)。
    • 固相捕获: 通过清洗芯片表面去除未结合和非特异性结合的DNA。
  4. 目标DNA洗脱与扩增(Elution & PCR Amplification):

    • 改变条件(如提高温度、使用低盐缓冲液)解除探针与目标DNA的结合,将捕获到的目标DNA片段从磁珠或芯片上洗脱下来。
    • 由于捕获洗脱后的目标DNA量较少,需要利用连接在文库片段接头上的通用引物进行有限循环数的PCR扩增,以富集足够量的目标DNA用于测序,并引入完整的测序所需接头序列。
  5. 高通量测序与数据分析(High-Throughput Sequencing & Data Analysis):

    • 将扩增富集后的文库加载到高通量测序平台进行测序。
    • 产生的海量测序数据(Raw Reads)经过质量控制(去除低质量读段和接头污染)。
    • 将高质量读段比对(Mapping)到人类参考基因组上。
    • 识别目标区域内的单核苷酸变异、插入缺失、拷贝数变异等遗传变异。
    • 进行变异注释、筛选及生物学意义解读。

二、核心技术优势

  1. 高深度测序: 将测序通量集中到目标区域,实现数百至数千倍的覆盖深度,极大提高低频突变(如肿瘤组织中的体细胞突变、线粒体异质性、母体血浆中的胎儿游离DNA突变)的检测灵敏度与准确性。
  2. 高特异性: 探针设计的特异性决定了目标区域捕获的效率,有效排除大量非目标区域的干扰背景。
  3. 成本效益: 相比全基因组测序,靶向测序只对感兴趣的特定区域进行深度测序,大大降低了每个样本的测序成本,尤其适用于需要大样本量或临床常规检测的项目。
  4. 灵活性: 探针设计灵活,可根据研究或临床需求定制靶向Panel(基因组合),覆盖从单个基因到数万个外显子(如临床外显子组)的范围。商业化Panel也覆盖常见疾病领域(如遗传性肿瘤、心血管疾病、神经发育障碍、药物代谢相关基因等)。
  5. 样本兼容性广: 对DNA起始量要求相对较低,并能兼容包括福尔马林固定石蜡包埋样本在内的多种样本类型。
  6. 简化数据分析: 数据量远小于全基因组数据,显著缩短了分析时间和计算资源需求,同时也减少了与疾病可能无关的海量数据的解读负担。

三、关键应用场景

四、技术挑战与局限

  1. 捕获效率与均一性: 不同目标区域的GC含量、二级结构、重复序列等差异会导致捕获效率不均一,部分区域覆盖深度不足,可能漏检变异。探针设计优化和捕获实验条件的标准化是关键。
  2. 脱靶效应: 探针与非目标区域的部分同源序列发生杂交,导致少量非目标区域被测序。虽然比率通常较低,但在某些应用中(如寻找新融合基因)可能引入干扰。
  3. 探针设计限制: 高度重复区域、端粒、着丝粒等复杂区域难以设计有效探针,限制了这些区域的捕获能力。探针设计也必须考虑已知的高度多态性区域(如HLA)。
  4. 大型结构变异检测局限: 对于大的插入缺失、拷贝数变异、染色体易位等结构性变异的检测敏感性和准确性,通常低于基于长读长测序或芯片的方法(如aCGH),需要结合特定算法优化。
  5. 新基因/区域发现受限: 仅能检测Panel预设的目标区域内的变异,无法发现Panel范围以外的新致病基因或变异。
  6. 实验流程相对复杂: 相较于扩增子测序(如多重PCR扩增子测序),捕获实验步骤较多(文库构建、杂交、捕获、洗脱、扩增),耗时更长,操作要求更高。

五、发展趋势展望

  • 更高性能探针: 开发更高效、特异性更强、均一性更好的探针合成技术(如基于芯片合成或酶法合成的超长探针)。
  • 多重靶向整合: 结合多重PCR扩增子技术与捕获杂交技术,实现更灵活、覆盖更全面的靶向检测。
  • 长读长测序整合: 探索将靶向捕获技术与长读长测序技术结合,以解决大型结构变异检测和高度同源区域分型的难题。
  • 一体化自动化解决方案: 开发整合文库构建、杂交捕获、扩增甚至部分生信分析的自动化平台,简化操作流程,提高结果稳定性和通量。
  • 超灵敏检测应用: 在液体活检(如ctDNA、CTC分析)、早期癌症筛查、微小残留病灶监测等对灵敏度要求极高的领域持续优化。
  • 标准与规范建立: 推动靶向测序在临床诊断中应用的标准化、规范化和室间质评。

结语:

靶向捕获测序作为基因组学领域的关键技术,凭借其精准锁定目标、深度挖掘变异、高性价比的优势,已成为基础研究、转化医学和临床诊断的强大工具。随着探针设计、实验流程和生信分析的持续优化,以及与其他前沿技术(如单细胞测序、空间转录组)的融合,靶向捕获测序必将在揭示生命奥秘、驱动精准医疗发展方面发挥更加核心和广泛的作用。