Hi-C

来自医学百科
223.160.139.182讨论2026年4月13日 (一) 13:45的版本 (建立内容为“<div style="padding: 0 4%; line-height: 1.8; color: #1e293b; font-family: 'Helvetica Neue', Helvetica, 'PingFang SC', Arial, sans-serif; background-color: #ffffff…”的新页面)
(差异) ←上一版本 | 最后版本 (差异) | 下一版本→ (差异)

Hi-C(High-throughput Chromosome Conformation Capture)是一种结合了染色质构象捕获(3C)技术与高通量测序(NGS)的前沿组学技术。它能够以全基因组尺度捕获染色质在三维空间中的物理相互作用,被誉为“3D 基因组学”的基石。Hi-C 技术揭示了染色质从局部 染色质环(Loops)、拓扑关联结构域(TADs)到宏观 A/B 隔室(Compartments)以及染色体领地(Territories)的多尺度分级折叠规律。在临床研究中,Hi-C 被广泛用于解析 增强子劫持、结构变异(SV)对基因表达的干扰,以及揭示复杂疾病的非编码区致病机制。

Hi-C 技术概览
全基因组 3D 交互图谱 · 点击展开
核心产物:全基因组交互热图
检测目标 全基因组 3D 构象
关键酶 MboI, DpnII, HindIII
分辨率范围 1 kb - 1 Mb
捕获类型 All-to-all (多对多)
数据规模 200M - 2B 对有效 Reads
首创年份 2009 (Aiden-Lieberman)

技术原理:从空间交联到序列解析

Hi-C 通过将空间上的邻近关系转化为 DNA 序列的共价连接,实现了三维信息的线性化映射:

  • 原位固定:使用甲醛处理细胞,将空间上物理邻近的染色质片段(即使在序列上相距甚远)通过蛋白质桥接进行交联。
  • 末端修复与生物素标记:使用限制性内切酶消化 DNA,并在断裂末端补齐含生物素标记的核苷酸。
  • 近端连接 (Proximity Ligation):在稀释或原位条件下进行连接,使得被标记的末端重新闭合,形成嵌合 DNA 分子。
  • 富集与测序:剪切 DNA 后利用链霉亲和素磁珠捕获带有生物素的连接位点片段,通过双端测序(Paired-end sequencing)获得交互对。
  • 空间衰减模型:接触概率 $P(s)$ 随线性距离 $s$ 呈幂律衰减,公式常表示为 $P(s) \propto s^{-\alpha}$。偏离该规律的显著信号即代表功能性的染色质交互。

应用景观:解析生命维度的拓扑奥秘

研究领域 核心科学问题 临床/科研价值
肿瘤基因组学 结构变异对 TAD 边界 的破坏。 识别增强子劫持导致的癌基因激活(如 MYC)。
精准发育生物学 Hox 基因簇 的时空构象演变。 解析胚胎发育中远端调控元件与启动子的动态交互。
非编码区变异解析 GWAS 风险位点(SNP)的目标基因。 通过 3D 接触将疾病相关 SNP 映射到其调控的靶基因。
进化遗传学 物种间染色质构象的保守性。 辅助染色体水平的基因组组装(Scaffolding)。

技术标准:Hi-C 数据的质量控制要点

由于 Hi-C 实验涉及复杂的生化操作,其数据产出的准确性依赖于以下核心环节:

  • 库复杂度 (Library Complexity):通过饱和度曲线评估非重复双端 Read 的比例。若复杂度过低,将限制 TAD 和 Loop 的检测灵敏度。
  • 顺式/反式比 (Cis/Trans Ratio):高质量的内聚实验中,染色体内(Cis)交互应显著多于染色体间(Trans)。高比例的反式交互常提示固定不足或存在大量随机漂浮 DNA。
  • ICE/KR 归一化:原始交互频数受测序偏差、GC 含量和酶切位点分布的影响。需使用 归一化算法(如 Iterative Correction)消除偏差。
  • 分辨率选择:分辨率取决于有效交互数的平方。检测 Loops 通常需要 5 kb 或更高精度的图谱,而分析 TADs 建议在 40 kb 分辨率。

关键相关概念

  • TAD (拓扑关联结构域):Hi-C 发现的最稳定结构单元,表现为热图中的沿对角线分布的三角形区域。
  • CTCF:在 TAD 边界形成绝缘子的关键蛋白,调控染色质环挤压
  • A/B 隔室:A 为转录活跃区,B 为抑制区,两者在空间上倾向于同类相互排斥及异类隔离。
  • Micro-C:Hi-C 的升级版,使用微球菌核酸酶 (MNase) 代替限制酶,可实现核小体水平的分辨率。
  • 4C / 5C:Hi-C 的前身技术,分别侧重于“一对多”或“多对多(局部)”的交互检测。
  • 增强子-启动子交互:决定细胞特征性基因表达的 3D 构象基础。
       学术参考文献与权威点评
       

[1] Lieberman-Aiden E, et al. (2009). Comprehensive Mapping of Long-Range Interactions Reveals Folding Principles of the Human Genome. Science. 326(5950):289-93.
[权威点评]:Hi-C 技术的开山之作,首次定义了 A/B 隔室和染色体分级折叠的分形理论。

[2] Dixon JR, et al. (2012). Topological domains in mammalian genomes identified by analysis of chromatin interactions. Nature. 485:376-80.
[核心价值]:首次在哺乳动物基因组中通过 Hi-C 鉴定出 TAD 结构,确立了其作为转录调控基本单位的地位。

[3] Dekker J, et al. (2013). The 3D genome as a new frontier. Genes & Development. 27(13):1421-32. [Academic Review]
[机制综述]:系统性总结了染色质构象捕获技术的发展史及其在人类疾病解析中的范式演变。

           3D 基因组学与拓扑调控 · 知识图谱
构象捕获 3C4C5CHi-CChIA-PETHiChIPMicro-C
拓扑分级 Chromosome TerritoryA/B CompartmentTADLoopSub-TAD
驱动因子 CTCFCohesin (凝聚蛋白)SMC1ARAD21WAPLMediator
生信工具 HiC-ProJuicerCoolerFit-Hi-CStrawHiGlass