CRISPR array
CRISPR array(CRISPR 阵列)是细菌和古菌基因组中赋予其适应性免疫能力的特殊 DNA 基因座,被形象地称为细菌免疫系统的“黑匣子”或“记忆库”。
从结构上看,它由高度保守的重复序列 (Direct Repeats) 和高度可变的间隔序列 (Spacers) 交替排列组成。这些间隔序列并非细菌自身的 DNA,而是捕获自曾经入侵过的噬菌体或质粒的片段。当外源核酸再次入侵时,CRISPR array 会转录生成 crRNA,指导 Cas 蛋白对外源基因进行特异性识别和降解。CRISPR array 的发现(1987年)早于 Cas 蛋白的功能解析,是整个 CRISPR 领域的起点。
结构解剖:三明治式的排列
CRISPR 这一名称(Clustered Regularly Interspaced Short Palindromic Repeats)本身就精确描述了该基因座的结构特征。
- 1. 前导序列 (Leader Sequence): 位于 CRISPR array 的上游(5'端),是一段富含 AT 的非编码序列,长约 100-500 bp。它充当了启动子的角色,驱动整个 CRISPR array 转录生成 Pre-crRNA,同时包含识别信号,指导 Cas1-Cas2 蛋白将新的间隔序列插入到阵列的最前端。
- 2. 重复序列 (Repeats): 阵列中多次出现的、序列完全相同的短片段(通常 20-50 bp)。它们通常含有部分回文序列,转录后能形成稳定的茎环结构(Stem-loop),是 Cas 蛋白识别和加工 Pre-crRNA 的“把手”。
- 3. 间隔序列 (Spacers): 位于两个重复序列之间,长度与重复序列相似。这是 CRISPR array 的核心内容,它们是捕获自外源病毒或质粒的 DNA 片段。细菌通过比对 Spacer 和入侵者的序列来判断是否发动攻击。
动态过程:记忆的写入 (Adaptation)
CRISPR array 不是静态的基因组结构,而是能够实时进化的动态记录仪。这一过程被称为“适应 (Adaptation)”或“获取 (Acquisition)”。
| 步骤 | 关键蛋白 | 生物学动作 |
|---|---|---|
| 1. 捕获 (Capture) | Cas1, Cas2 | 识别并切除入侵 DNA 中邻近 PAM 的片段(称为原间隔序列 Protospacer)。 |
| 2. 整合 (Integration) | Cas1-Cas2 复合物, IHF | 将新捕获的片段插入到 Leader 序列和第一个 Repeat 之间。 |
| 3. 复制 (Duplication) | DNA 聚合酶 | 修复缺口,由于插入机制,还会复制产生一个新的 Repeat,保持“R-S-R”结构。 |
| 结果 | 时序性记忆 | 最新的病毒记忆总是位于阵列的最前端(Leader 端),优先被转录。 |
历史与意义
- 偶然发现: 1987年,日本科学家 Yoshizumi Ishino 在研究大肠杆菌 iap 基因时,偶然发现了这段奇怪的“重复-间隔”序列,但当时并不清楚其功能。这是人类首次记录到 CRISPR array。
- 功能破解: 直到 2005 年,西班牙科学家 Francisco Mojica 发现这些间隔序列 (Spacers) 与已知噬菌体的序列完美匹配,从而大胆提出了“这是细菌免疫系统”的假说。
- 生物条形码: 由于 CRISPR array 中的 Spacer 记录了细菌的感染历史,科学家现在常利用 CRISPR分型 (Spoligotyping) 技术来追踪病原菌(如结核分枝杆菌)的演化和传播路径。
学术参考文献 [Academic Review]
[1] Ishino Y, et al. (1987). Nucleotide sequence of the iap gene, responsible for alkaline phosphatase isozyme conversion in Escherichia coli, and identification of the gene product. Journal of Bacteriology.
[点评]:历史性文献。首次描述了 CRISPR 序列的存在,尽管当时作者仅将其描述为“一组具有二重对称性的异常序列”。
[2] Mojica FJ, et al. (2005). Intervening sequences of regularly spaced prokaryotic repeats derive from foreign genetic elements. Journal of Molecular Evolution.
[点评]:关键突破。通过生物信息学分析,首次揭示了 Spacer 来源于外源病毒,确立了 CRISPR 作为免疫系统的身份。
[3] Barrangou R, et al. (2007). CRISPR provides acquired resistance against viruses in prokaryotes. Science.
[点评]:通过噬菌体攻击嗜热链球菌的实验,确凿证明了获得新的 Spacer 能够赋予细菌对特定噬菌体的抵抗力。