单核苷酸变异
单核苷酸变异(Single Nucleotide Variant,SNV)是基因组中最基本、最常见的变异形式,指在基因组特定位置上发生的单个核苷酸(A、T、C、G)的替换。与结构变异 (SV) 这种“地壳运动”般的大尺度重排不同,SNV 类似于书写中的“拼写错误”。
虽然单个 SNV 的影响可能微乎其微,但它们是人类遗传多样性(如肤色、血型)的主要来源,也是许多遗传病(如镰刀型贫血)和癌症(如 EGFR 突变)的直接致病原因。在生物信息学分析中,SNV 的检测通常依赖于高准确度的二代测序 (NGS) 技术(如 Illumina)。
变异类型:转换与颠换
从化学结构的角度,碱基分为嘌呤(A, G)和嘧啶(C, T)。据此,SNV 被分为两类,其发生频率和生物学意义各不相同。
- 转换 (Transition, Ti): 同类碱基之间的替换。即 嘌呤$\leftrightarrow$嘌呤 (A$\leftrightarrow$G) 或 嘧啶$\leftrightarrow$嘧啶 (C$\leftrightarrow$T)。由于分子结构变化较小,转换发生的概率通常是颠换的 2 倍。
- 颠换 (Transversion, Tv): 不同类碱基之间的替换。即 嘌呤$\leftrightarrow$嘧啶 (如 A$\leftrightarrow$C, G$\leftrightarrow$T)。
- Ti/Tv 比值: 在全基因组测序中,Ti/Tv 比值通常约为 2.0-2.1;在全外显子组中约为 3.0。这不仅是进化特征,也是评估测序数据质量的重要 QC 指标。
概念辨析:SNV vs SNP
这两个术语常被混用,但在严格的遗传学语境下有明确界限:
| 术语 | 全称 | 定义标准 |
|---|---|---|
| SNV | Single Nucleotide Variant | 广义术语。指任何单碱基的改变,无论其在群体中是否常见。包括罕见的体细胞突变(如癌症中的特有突变)。 |
| SNP | Single Nucleotide Polymorphism | 狭义术语。指在群体中出现频率 > 1% 的 SNV。通常被认为是“正常”的遗传多态性,常用于 GWAS 研究。 |
功能影响:从沉默到致死
发生在编码区(Exon)的 SNV 根据其对蛋白质翻译的影响,分为三种主要后果:
● 同义突变 (Synonymous): 碱基改变但氨基酸不变(密码子简并性)。通常认为是“沉默”的,但有时影响 mRNA 稳定性。
● 错义突变 (Missense): 碱基改变导致氨基酸改变(如 镰刀型贫血中的 A$\rightarrow$T 导致谷氨酸$\rightarrow$缬氨酸)。这是许多显性遗传病的主因。
● 无义突变 (Nonsense): 碱基改变提前产生终止密码子 (Stop Codon)。导致蛋白截断(Truncation),通常会导致蛋白功能完全丧失(LOF)。
学术参考文献 [Academic Review]
[1] Sherry ST, et al. (2001). dbSNP: the NCBI database of genetic variation. Nucleic Acids Research.
[点评]:介绍了全球最权威的 SNV/SNP 数据库 dbSNP,奠定了变异注释的基础(rsID)。
[2] The 1000 Genomes Project Consortium. (2015). A global reference for human genetic variation. Nature.
[点评]:里程碑项目。通过对 2500 多人的全基因组测序,系统性地鉴定了人类基因组中超过 8000 万个 SNV。
[3] Tate JG, et al. (2019). COSMIC: the Catalogue Of Somatic Mutations In Cancer. Nucleic Acids Research.
[点评]:专注于癌症体细胞突变(Somatic SNV)的数据库,是肿瘤精准医疗的重要参考。