三维基因组
三维基因组(Three-Dimensional Genomics / 3D Genome)是研究真核生物细胞核内全基因组 DNA 空间折叠结构及其调控功能的学科。人类基因组 DNA 拉直后长达 2 米,却能折叠容纳在直径仅 10 微米的细胞核中。这种折叠并非杂乱无章,而是遵循着严格的层级规律(从染色体疆域到TAD再到染色质环)。三维基因组学揭示了“远距离调控”的物理基础:位于线刑序列上相距甚远的增强子和启动子,通过空间折叠在三维空间中“见面”,从而启动基因表达。该领域的突破主要得益于 Hi-C 等染色体构象捕获技术的发明。
层级结构:细胞核内的“折叠艺术”
三维基因组并不是一团乱麻,而是像俄罗斯套娃一样,具有精细的四级层级结构:
| 层级 (Scale) | 结构名称 | 特征描述 |
|---|---|---|
| Level 1 (最大尺度) |
染色体疆域 (Chromosome Territories) |
每条染色体在细胞核内都有自己专属的“领地”,互不交织。 |
| Level 2 (功能分区) |
A/B 区室 (Compartments) |
• A 区室: 位于核中央,富含基因,转录活跃(常染色质)。 |
| Level 3 (基本单元) |
TAD (拓扑关联结构域) |
大小约 1Mb。是调控的“独立社区”。社区内的 DNA 频繁互动,但很少与社区外的 DNA 互动。边界通常由 CTCF 绝缘子界定。 |
| Level 4 (精细调控) |
染色质环 (Chromatin Loops) |
TAD 内部形成的环状结构,将增强子直接拉到启动子面前,启动基因转录。 |
技术革命:Hi-C 技术
原理:邻近连接 (Proximity Ligation)
我们如何知道两个 DNA 片段在空间上挨得近?核心逻辑是“甲醛交联”。
1. 固定: 用甲醛将细胞核内空间上靠近的 DNA 片段“粘”在一起(即使它们在线性序列上相距很远)。
2. 酶切与连接: 切断 DNA,然后用生物素标记末端,并将物理上连接在一起的片段重新连接起来。
3. 测序: 测序这些“嵌合”片段。如果片段 A 和片段 B 经常被测到连在一起,说明它们在三维空间中是邻居。
为什么重要?
在 1D 基因组时代,我们发现了大量的 GWAS 变异位点位于非编码区(“垃圾 DNA”)。
在 3D 基因组时代,我们发现这些变异往往位于远端增强子上。通过 Hi-C 图谱,我们可以追踪到这些增强子究竟在空间上接触了哪个靶基因,从而完美解释疾病机理。
🧬 疾病模型:TAD 边界破坏
TAD 就像基因组的“防火墙”。如果 TAD 边界(绝缘子)发生缺失或突变:
后果: 原本被隔离在外部的强增强子会“入侵”内部,错误地激活致癌基因。
实例: 在肢体发育畸形(如多指症)中,TAD 边界的破坏导致 EPHA4 的增强子错误地激活了 WNT6 基因。
学术参考文献
[1] Lieberman-Aiden E, et al. (2009). Comprehensive mapping of long-range interactions reveals folding principles of the human genome. Science. 2009;326(5950):289-293.
[Hi-C发明]:发明了 Hi-C 技术,首次绘制了全基因组 3D 图谱,并提出了 A/B 区室的概念。
[2] Dixon JR, et al. (2012). Topological domains in mammalian genomes identified by analysis of chromatin interactions. Nature. 2012;485(7398):376-380.
[发现TAD]:首次定义了“拓扑关联结构域” (TAD) 这一基因组折叠的基本单元。
[3] Rao SS, et al. (2014). A 3D map of the human genome at kilobase resolution reveals principles of chromatin looping. Cell. 2014;159(7):1665-1680.
[高分辨率]:通过原位 Hi-C 技术,将分辨率提高到 1kb,清晰展示了 CTCF/Cohesin 介导的环挤出机制。