CNV
拷贝数变异(Copy Number Variation,CNV)属于结构变异 (SV) 的一种主要形式,指基因组中长度大于 1 kb(现代定义常下探至 50 bp)的 DNA 片段发生的拷贝数目改变。与正常的二倍体基因组(2拷贝)相比,CNV 表现为基因组片段的缺失(Deletion, copy < 2)或重复/扩增(Duplication/Amplification, copy > 2)。
CNV 是人类遗传多样性的重要来源,其覆盖的核苷酸总数远超单核苷酸变异 (SNV)。在临床上,生殖系 CNV 常导致微缺失/微重复综合征(如唐氏综合征),而体细胞 CNV 则是癌症发生发展的核心驱动力(如 HER2 扩增)。传统的检测金标准是基因芯片 (Array CGH),而现在基于二代测序的深度覆盖分析正逐渐成为主流。
致病机制:基因剂量效应
CNV 致病的核心在于破坏了基因表达的剂量平衡(Gene Dosage Balance)。
- 单倍剂量不足 (Haploinsufficiency): 发生杂合缺失(Copy Number = 1),导致该基因编码的蛋白质产量减半,不足以维持正常生理功能。
案例: P53 肿瘤抑制基因的丢失,或 22q11.2 缺失综合征。 - 三倍剂量敏感 (Triplosensitivity): 发生重复或扩增(Copy Number $\ge$ 3),导致蛋白质过量表达,产生毒性或异常信号激活。
案例: PMP22 基因重复导致腓骨肌萎缩症 (CMT1A),或 原癌基因 的激活。 - 位置效应: 有时 CNV 本身不破坏编码区,但删除了调控元件(如增强子),导致邻近基因沉默或异位表达。
检测技术:从芯片到测序
CNV 检测经历了从低分辨率到单碱基分辨率的跨越:
| 技术代际 | 代表方法 | 原理解析 |
|---|---|---|
| 一代 (细胞遗传) | 核型分析, FISH | 显微镜下观察。只能检测 Mb 级别的巨大缺失或扩增。FISH 需预知靶点,通量低。 |
| 二代 (芯片) | Array CGH, SNP Array | CNV检测的金标准。通过比较样本与对照 DNA 的杂交信号强度比值(Log2 Ratio)来判断拷贝数。 |
| 三代 (测序) | WGS / WES | 利用Read Depth(测序深度)算法。某个区域的 Reads 数显著高于平均值则为扩增,反之则为缺失。能精确定位断点。 |
临床肿瘤:驱动基因扩增
在实体瘤中,CNV(基因扩增)是比点突变更为显著的特征,直接指导靶向用药。
● 乳腺癌: HER2 (ERBB2) 基因扩增(CNV $\ge$ 4~6)。约 20% 乳腺癌患者携带此变异,是使用曲妥珠单抗 (Herceptin) 的绝对指征。
● 肺癌: MET 基因扩增是 EGFR-TKI 耐药的主要机制之一,也是 MET 抑制剂(如赛沃替尼)的靶点。
● 神经胶质瘤: EGFR vIII 扩增常伴随染色体外 DNA (ecDNA) 形式存在,导致肿瘤极具侵袭性。
学术参考文献 [Academic Review]
[1] Redon R, et al. (2006). Global variation in copy number in the human genome. Nature.
[点评]:里程碑式论文。首次绘制了人类基因组的 CNV 图谱,颠覆了“人类基因组 99.9% 相同”的传统认知,证明 CNV 是遗传变异的主要形式。
[2] Sebat J, et al. (2004). Large-scale copy number polymorphism in the human genome. Science.
[点评]:早期发现健康人中也普遍存在大规模 CNV,奠定了良性 CNV 多态性的概念基础。
[3] Zack TI, et al. (2013). Pan-cancer patterns of somatic copy number alteration. Nature Genetics.
[点评]:系统分析了数千例癌症样本,揭示了体细胞 CNV (SCNA) 在肿瘤发生中的普遍性和特定模式(如全基因组加倍)。