Hi-C
Hi-C(High-throughput Chromosome Conformation Capture)是一种结合了染色质构象捕获(3C)技术与高通量测序(NGS)的前沿组学技术。它能够以全基因组尺度捕获染色质在三维空间中的物理相互作用,被誉为“3D 基因组学”的基石。Hi-C 技术揭示了染色质从局部 染色质环(Loops)、拓扑关联结构域(TADs)到宏观 A/B 隔室(Compartments)以及染色体领地(Territories)的多尺度分级折叠规律。在临床研究中,Hi-C 被广泛用于解析 增强子劫持、结构变异(SV)对基因表达的干扰,以及揭示复杂疾病的非编码区致病机制。
技术原理:从空间交联到序列解析
Hi-C 通过将空间上的邻近关系转化为 DNA 序列的共价连接,实现了三维信息的线性化映射:
- 原位固定:使用甲醛处理细胞,将空间上物理邻近的染色质片段(即使在序列上相距甚远)通过蛋白质桥接进行交联。
- 末端修复与生物素标记:使用限制性内切酶消化 DNA,并在断裂末端补齐含生物素标记的核苷酸。
- 近端连接 (Proximity Ligation):在稀释或原位条件下进行连接,使得被标记的末端重新闭合,形成嵌合 DNA 分子。
- 富集与测序:剪切 DNA 后利用链霉亲和素磁珠捕获带有生物素的连接位点片段,通过双端测序(Paired-end sequencing)获得交互对。
- 空间衰减模型:接触概率 $P(s)$ 随线性距离 $s$ 呈幂律衰减,公式常表示为 $P(s) \propto s^{-\alpha}$。偏离该规律的显著信号即代表功能性的染色质交互。
应用景观:解析生命维度的拓扑奥秘
| 研究领域 | 核心科学问题 | 临床/科研价值 |
|---|---|---|
| 肿瘤基因组学 | 结构变异对 TAD 边界 的破坏。 | 识别增强子劫持导致的癌基因激活(如 MYC)。 |
| 精准发育生物学 | Hox 基因簇 的时空构象演变。 | 解析胚胎发育中远端调控元件与启动子的动态交互。 |
| 非编码区变异解析 | GWAS 风险位点(SNP)的目标基因。 | 通过 3D 接触将疾病相关 SNP 映射到其调控的靶基因。 |
| 进化遗传学 | 物种间染色质构象的保守性。 | 辅助染色体水平的基因组组装(Scaffolding)。 |
技术标准:Hi-C 数据的质量控制要点
由于 Hi-C 实验涉及复杂的生化操作,其数据产出的准确性依赖于以下核心环节:
- 库复杂度 (Library Complexity):通过饱和度曲线评估非重复双端 Read 的比例。若复杂度过低,将限制 TAD 和 Loop 的检测灵敏度。
- 顺式/反式比 (Cis/Trans Ratio):高质量的内聚实验中,染色体内(Cis)交互应显著多于染色体间(Trans)。高比例的反式交互常提示固定不足或存在大量随机漂浮 DNA。
- ICE/KR 归一化:原始交互频数受测序偏差、GC 含量和酶切位点分布的影响。需使用 归一化算法(如 Iterative Correction)消除偏差。
- 分辨率选择:分辨率取决于有效交互数的平方。检测 Loops 通常需要 5 kb 或更高精度的图谱,而分析 TADs 建议在 40 kb 分辨率。
关键相关概念
学术参考文献与权威点评
[1] Lieberman-Aiden E, et al. (2009). Comprehensive Mapping of Long-Range Interactions Reveals Folding Principles of the Human Genome. Science. 326(5950):289-93.
[权威点评]:Hi-C 技术的开山之作,首次定义了 A/B 隔室和染色体分级折叠的分形理论。
[2] Dixon JR, et al. (2012). Topological domains in mammalian genomes identified by analysis of chromatin interactions. Nature. 485:376-80.
[核心价值]:首次在哺乳动物基因组中通过 Hi-C 鉴定出 TAD 结构,确立了其作为转录调控基本单位的地位。
[3] Dekker J, et al. (2013). The 3D genome as a new frontier. Genes & Development. 27(13):1421-32. [Academic Review]
[机制综述]:系统性总结了染色质构象捕获技术的发展史及其在人类疾病解析中的范式演变。