Leader sequence
Leader sequence(前导序列,CRISPR Leader)是位于细菌 CRISPR array(CRISPR 阵列)上游(5'端)的一段非编码 DNA 序列。它富含 A/T 碱基,长度通常在 100 到 500 bp 之间。
Leader 序列在 CRISPR 免疫系统中扮演着“指挥官”的双重角色:首先,它充当启动子 (Promoter),驱动下游 CRISPR 阵列转录生成 Pre-crRNA;其次,它包含特定的识别信号(锚定位点),指导适应性蛋白复合物(Cas1-Cas2)精准地识别阵列的“起始端”,从而确保新的病毒记忆(Spacer)总是被插入到阵列的最前面。这种定向插入机制保证了 CRISPR 系统能够优先应对最近遇到的威胁。
核心功能:定向与驱动
Leader 序列虽然不直接编码蛋白质,但它是整个 CRISPR 系统的逻辑控制中心。
- 1. 转录启动子 (Transcriptional Promoter): Leader 序列包含 RNA 聚合酶的结合位点(如 -10 和 -35 区),负责启动下游长链 Pre-crRNA 的转录。这意味着 CRISPR 阵列是有方向性的,Leader 所在的一端为 5' 端。
- 2. 极性适应 (Polarized Adaptation): 细菌在捕获外源 DNA 后,必须将其插入到阵列的 Leader 端,而不是中间或尾部。这种“极性”由 Leader 序列上的特定基序(Motif)决定。Cas1-Cas2 复合物通过识别 Leader 和第一个重复序列(Repeat)之间的连接区(Leader-Repeat Junction),进行亲核攻击,打开 DNA 双链,完成新 Spacer 的植入。
- 3. 宿主因子招募: 在许多物种(如大肠杆菌)中,Leader 序列包含整合宿主因子 (IHF) 的结合位点。IHF 结合后会使 DNA 发生 180° 弯曲,帮助 Cas1-Cas2 复合物正确呈递外源 DNA 片段,提高整合效率。
Leader 的重要性:时序性免疫
CRISPR 系统的“记忆”是有时间顺序的。Leader 序列的存在确保了这种时序性。
| 位置 | 距离 Leader | 免疫意义 |
|---|---|---|
| 5' 端 (Leader 近端) | 最近 | 记录了最新遇到的病毒。转录效率最高,产生的 crRNA 丰度最大,提供最强的免疫保护。 |
| 中间区域 | 中等 | 较旧的感染记录。随着阵列扩增,转录水平可能逐渐降低。 |
| 3' 端 (Leader 远端) | 最远 | 古老的记忆。可能因突变而退化,或转录水平极低,往往代表不再流行的病毒株。 |
技术应用与改造
- CRISPR 录音机: 在利用 Cas1-Cas2 系统构建“细胞内录音机”或“分子时钟”的研究中,Leader 序列是关键元件。科学家通过设计 Leader,使细胞按时间顺序不断摄取环境中的 DNA 信号并转化为 Spacer,从而记录细胞的经历。
- 合成启动子替换: 在基因编辑应用(如 CRISPRa/i)中,为了更精确地控制 sgRNA 的表达水平,天然的 Leader 序列常被替换为人工合成的强启动子(如 U6, T7, J23119 等),以实现异源系统中的高效转录。
学术参考文献 [Academic Review]
[1] Yosef I, et al. (2012). DNA motifs determining the efficiency of adaptation into the Escherichia coli CRISPR array. PNAS.
[点评]:该研究揭示了 Leader 序列中的特定基序对新 Spacer 的整合效率至关重要,并指出了第一重复序列在其中的独特作用。
[2] Nuñez JK, et al. (2015). Integrase-mediated spacer acquisition during CRISPR-Cas adaptive immunity. Nature.
[点评]:Jennifer Doudna 团队详细解析了 Cas1-Cas2 复合物如何识别 Leader 序列的结构机制,解释了极性插入的分子基础。
[3] McGinn J, et al. (2019). DNA supercoiling facilitates spacer acquisition at the CRISPR leader-repeat junction. PLoS Genetics.
[点评]:探讨了 Leader 序列区域的 DNA 拓扑结构(超螺旋)和 IHF 蛋白如何协同作用,促进 CRISPR 系统的记忆获取。