CRISPR array

来自医学百科
77921020讨论 | 贡献2026年2月4日 (三) 19:02的版本 (建立内容为“<div style="padding: 0 4%; line-height: 1.8; color: #1e293b; font-family: 'Helvetica Neue', Helvetica, 'PingFang SC', Arial, sans-serif; background-color: #ffffff…”的新页面)
(差异) ←上一版本 | 最后版本 (差异) | 下一版本→ (差异)

CRISPR array(CRISPR 阵列)是细菌和古菌基因组中赋予其适应性免疫能力的特殊 DNA 基因座,被形象地称为细菌免疫系统的“黑匣子”或“记忆库”。
从结构上看,它由高度保守的重复序列 (Direct Repeats) 和高度可变的间隔序列 (Spacers) 交替排列组成。这些间隔序列并非细菌自身的 DNA,而是捕获自曾经入侵过的噬菌体或质粒的片段。当外源核酸再次入侵时,CRISPR array 会转录生成 crRNA,指导 Cas 蛋白对外源基因进行特异性识别和降解。CRISPR array 的发现(1987年)早于 Cas 蛋白的功能解析,是整个 CRISPR 领域的起点。

CRISPR Array
Clustered Regularly Interspaced Short Palindromic Repeats (点击展开)
                   📚
基因组的“病毒档案库”
结构特征
分布 ~40% 细菌, ~90% 古菌
重复序列 (R) 21-48 bp (回文结构)
间隔序列 (S) 26-72 bp (病毒来源)
调控区域 Leader Sequence (启动子)
功能机制
获取机制 Cas1 - Cas2 整合
转录产物 Pre-crRNA
首次发现 1987年 (大肠杆菌)

结构解剖:三明治式的排列


CRISPR 这一名称(Clustered Regularly Interspaced Short Palindromic Repeats)本身就精确描述了该基因座的结构特征。

  • 1. 前导序列 (Leader Sequence): 位于 CRISPR array 的上游(5'端),是一段富含 AT 的非编码序列,长约 100-500 bp。它充当了启动子的角色,驱动整个 CRISPR array 转录生成 Pre-crRNA,同时包含识别信号,指导 Cas1-Cas2 蛋白将新的间隔序列插入到阵列的最前端。
  • 2. 重复序列 (Repeats): 阵列中多次出现的、序列完全相同的短片段(通常 20-50 bp)。它们通常含有部分回文序列,转录后能形成稳定的茎环结构(Stem-loop),是 Cas 蛋白识别和加工 Pre-crRNA 的“把手”。
  • 3. 间隔序列 (Spacers): 位于两个重复序列之间,长度与重复序列相似。这是 CRISPR array 的核心内容,它们是捕获自外源病毒或质粒的 DNA 片段。细菌通过比对 Spacer 和入侵者的序列来判断是否发动攻击。

动态过程:记忆的写入 (Adaptation)

CRISPR array 不是静态的基因组结构,而是能够实时进化的动态记录仪。这一过程被称为“适应 (Adaptation)”或“获取 (Acquisition)”。

步骤 关键蛋白 生物学动作
1. 捕获 (Capture) Cas1, Cas2 识别并切除入侵 DNA 中邻近 PAM 的片段(称为原间隔序列 Protospacer)。
2. 整合 (Integration) Cas1-Cas2 复合物, IHF 将新捕获的片段插入到 Leader 序列和第一个 Repeat 之间。
3. 复制 (Duplication) DNA 聚合酶 修复缺口,由于插入机制,还会复制产生一个新的 Repeat,保持“R-S-R”结构。
结果 时序性记忆 最新的病毒记忆总是位于阵列的最前端(Leader 端),优先被转录。

历史与意义

  • 偶然发现: 1987年,日本科学家 Yoshizumi Ishino 在研究大肠杆菌 iap 基因时,偶然发现了这段奇怪的“重复-间隔”序列,但当时并不清楚其功能。这是人类首次记录到 CRISPR array。
  • 功能破解: 直到 2005 年,西班牙科学家 Francisco Mojica 发现这些间隔序列 (Spacers) 与已知噬菌体的序列完美匹配,从而大胆提出了“这是细菌免疫系统”的假说。
  • 生物条形码: 由于 CRISPR array 中的 Spacer 记录了细菌的感染历史,科学家现在常利用 CRISPR分型 (Spoligotyping) 技术来追踪病原菌(如结核分枝杆菌)的演化和传播路径。
       学术参考文献 [Academic Review]
       

[1] Ishino Y, et al. (1987). Nucleotide sequence of the iap gene, responsible for alkaline phosphatase isozyme conversion in Escherichia coli, and identification of the gene product. Journal of Bacteriology.
[点评]:历史性文献。首次描述了 CRISPR 序列的存在,尽管当时作者仅将其描述为“一组具有二重对称性的异常序列”。

[2] Mojica FJ, et al. (2005). Intervening sequences of regularly spaced prokaryotic repeats derive from foreign genetic elements. Journal of Molecular Evolution.
[点评]:关键突破。通过生物信息学分析,首次揭示了 Spacer 来源于外源病毒,确立了 CRISPR 作为免疫系统的身份。

[3] Barrangou R, et al. (2007). CRISPR provides acquired resistance against viruses in prokaryotes. Science.
[点评]:通过噬菌体攻击嗜热链球菌的实验,确凿证明了获得新的 Spacer 能够赋予细菌对特定噬菌体的抵抗力。

           CRISPR 系统组件 · 知识图谱
上级分类 基因组 • 非编码 DNA 区域
核心结构 Leader sequence • Repeats • Spacers
相关功能 Pre-crRNA (转录) • Cas1/Cas2 (插入)