sgRNA/pegRNA设计及合成技术指南
引言 sgRNA(单导向RNA)和pegRNA(引物编辑向导RNA)是CRISPR基因编辑系统的核心组件。sgRNA引导Cas9蛋白靶向特定基因组位点进行切割,实现基因敲除或基于同源定向修复(HDR)的编辑。pegRNA则用于更精确、更灵活的“先导编辑”技术,能在不依赖DNA双链断裂和供体模板的情况下实现多种类型的碱基替换、小片段插入或删除(indels)。掌握其设计与合成方法是基因编辑实验成功的关键。
一、 sgRNA设计原则
sgRNA的长度通常为20个核苷酸,位于其3'端的NGG序列(称为PAM,原型间隔相邻基序)是SpCas9识别的标志(其他Cas变体识别不同PAM)。目标编辑位点必须紧邻PAM序列(5'-N20-NGG-3')。
-
靶点选择:
- 特异性: 使用权威基因组数据库比对,确保设计的sgRNA序列在全基因组范围内具有唯一性(推荐≥3个碱基错配)。避免富含重复序列区域。
- 位置: 根据编辑目的选择靶点位置。敲除需靠近编码区起始位置;HDR需靠近预编辑位点(理想距离<10-50 bp)。
- GC含量: 推荐40%-60%。GC过低稳定性差,GC过高可能增加脱靶风险。
- 避免多聚碱基: 避免连续4个及以上相同碱基(如TTTT, GGGG)。
-
序列设计流程:
- 确定目标编辑区域及其上下游序列。
- 搜索符合“N20-NGG”格式的所有潜在靶点序列。
- 使用在线设计工具(如CRISPRscan, CHOPCHOP, Benchling)进行特异性打分、潜在脱靶位点预测、GC含量分析。
- 对得分较高的候选sgRNA进行脱靶效应评估(尤其关注预测的高分脱靶位点是否位于功能基因区)。
- 选择2-3个最优候选进行实验验证。
二、 pegRNA设计原则
pegRNA在sgRNA基础上增加了两个关键功能域(位于3'端):
- 引物结合位点(PBS): 13-17 nt,与靶DNA切断后产生的非模板链(RTT结合前)互补结合,作为逆转录引物。
- 逆转录模板(RTT): 10-25 nt(含编辑序列),包含期望的编辑序列及其3'端侧翼同源序列。模板序列需与靶位点模板链互补。
pegRNA整体结构:5' - [20 nt spacer/gRNA序列] - [gRNA scaffold] - [PBS] - [RTT] - 3'
-
编辑序列设计:
- 明确目标编辑类型(点突变、插入、缺失)。
- 在RTT中设计包含所需编辑的序列。所需编辑应位于RTT的5'端部分(靠近PBS端)。
-
PBS设计:
- 长度: 13-17 nt(常用13-15 nt)。
- Tm值: 推荐30°C-60°C(常用工具计算)。Tm过低结合弱,过高可能阻碍编辑复合物解离或增加错误结合风险。
- 位置: PBS必须与Cas9切割位点3'端下游的非模板链序列(切割后暴露的单链区)精确互补。切割位点位于PAM上游第3个碱基处(N20-NGG^|N,切割点在^处)。
- 避免二级结构: 尽量减少PBS自身或与邻近序列形成稳定的二级结构。
-
RTT设计:
- 长度: 包含编辑序列及其3'端足够的同源臂(通常总长10-25 nt)。同源臂长度需保证编辑效率(通常≥10 nt)。
- 编辑位置: 期望的编辑点应位于RTT的5'端(紧接PBS之后)。
- 避免互补性: RTT序列不应与PBS或spacer序列存在显著互补性,防止形成阻碍逆转录的二级结构。
- 同源性: RTT的3'端(同源臂)必须与靶位点Cas9切割位点3'端下游的模板链序列精确互补。切割位点下游的同源臂长度影响效率和保真度。
-
整体优化:
- spacer部分: 遵循sgRNA设计原则(特异性、GC含量等)。
- GC含量: 整个pegRNA(尤其PBS+RTT)GC含量建议40%-60%。
- 结构预测: 使用RNA折叠软件预测pegRNA的二级结构,避免PBS或RTT关键区域被包裹。
- 工具辅助: 使用专门的pegRNA设计工具(如pegFinder, PE-Designer)可自动化上述流程并提供打分。
三、 sgRNA/pegRNA的合成
sgRNA/pegRNA主要通过两种方法制备:化学合成和体外转录(IVT)。
-
化学合成:
- 原理: 基于固相亚磷酰胺三酯法,在自动化合成仪上由3'端向5'端逐步添加核苷酸。
- 优点:
- 精准性: 可合成任意序列,包括大量修饰碱基(如硫代磷酸、2'-O-甲基、锁核酸)。
- 高纯度: 经HPLC纯化可获得极高纯度的终产物(>95%)。
- 长度优势: 尤其适合合成较长的pegRNA(可达200 nt)。
- 缺点:
- 成本: 长度越长,成本越高昂。
- 规模限制: 大规模合成成本效益低。
- 关键步骤:
- 序列输入与修饰: 提供精确序列,指定修饰位点(如5'端磷酸化利于连接)。
- 合成: 在合成仪上进行循环偶联、加帽、氧化等反应。
- 脱保护与切割: 从固相载体上切下RNA并去除保护基团。
- 纯化: 采用HPLC或PAGE进行精细纯化,去除缺失序列、截短体杂质。
- 质控: 质谱测定分子量,分析色谱图评估纯度。
-
体外转录(IVT):
- 原理: 利用噬菌体RNA聚合酶(如T7, SP6, T3)在体外以DNA模板指导合成RNA。
- 优点:
- 成本效益: 特别适合大规模制备(微克至毫克级)。
- 操作简便: 流程相对标准化。
- 缺点:
- 序列限制: 需要5'端特定的启动子序列(如T7启动子要求5'-GGG或GA开头)。
- 均一性: 产物可能包含异质3'端(非模板加尾)。
- 修饰困难: 引入特殊化学修饰不如化学合成方便。
- 长度限制: 超长转录本(>150 nt)效率可能降低。
- 关键步骤:
- 模板制备:
- 引物法: 设计包含启动子序列(如T7启动子:5'-TAATACGACTCACTATAG-3')的正向引物和反向引物,通过PCR扩增获得线性双链DNA模板。
- 质粒法: 将目标序列克隆到含相应启动子的质粒中,酶切线性化质粒。
- 体外转录反应: 在含NTPs、Mg²⁺、缓冲液、RNA酶抑制剂和RNA聚合酶的体系中孵育模板DNA。
- DNA模板去除: 加入DNase I消化模板DNA。
- 纯化: 常用沉淀法(乙醇/异丙醇沉淀)或柱纯化法(硅胶膜或离心柱)去除蛋白质、盐离子、未掺入的NTPs和短片段RNA。高要求时可用PAGE纯化。
- 质控: 琼脂糖凝胶电泳检测大小和纯度,Nanodrop分光光度计定量。
- 模板制备:
-
合成策略选择:
- sgRNA: 化学合成(常用,尤其带修饰)和IVT均可。
- pegRNA: 强烈推荐化学合成。因其结构复杂、较长、常需修饰以提高稳定性,化学合成在精准性、纯度和定制灵活性上更具优势。
四、 应用与重要性
- sgRNA: CRISPR-Cas9基因敲除(Knockout)、CRISPRi/a(干扰/激活)、基于HDR的精准基因敲入(Knock-in)或点突变修复。
- pegRNA: 先导编辑(Prime Editing)。优势:
- 编辑类型广: 所有12种碱基转换、小片段插入/缺失。
- 无需DSB: 显著降低indels等副产物和染色体畸变风险。
- 无需供体DNA: 简化实验设计,提高效率(尤其难转染细胞)。
- 灵活性高: 编辑位置选择自由度更大(理论上靶点只需靠近PAM)。
- 保真度高: 编辑副产物相对较少。
五、 质量控制与储存
- 纯度: HPLC峰图单峰,PAGE胶图主带清晰无杂带。
- 完整性: 质谱确认分子量准确,凝胶电泳确认条带大小正确。
- 浓度: 分光光度法精确定量(OD260,考虑消光系数)。
- 功能性验证: 在细胞模型或体外切割实验中验证活性(最重要)。
- 储存: 溶解于无RNase水或缓冲液(如10 mM Tris-HCl, pH 7.5),分装后-80°C长期保存。避免反复冻融。
结论
sgRNA和pegRNA的设计与合成是CRISPR技术成功应用的基石。精确遵循sgRNA的设计规则(特异性、GC含量、位置)是基础。pegRNA的设计更为复杂,需精心构建PBS和RTT,并利用专业工具进行优化。在合成路线上,化学合成凭借其精准性和灵活性,尤其适用于结构复杂且常需修饰的pegRNA制备;而IVT则是大规模制备sgRNA的经济之选。严格的质量控制和功能验证是确保编辑效率和安全性的最终保障。随着基因编辑技术的飞速发展,sgRNA/pegRNA的设计合成策略将持续优化,为基础科研和未来基因治疗提供更强大的工具。