SNP
单核苷酸多态性(Single Nucleotide Polymorphism, SNP)是人类基因组中最常见的一种遗传变异形式,指在基因组水平上由单个核苷酸(A、T、C 或 G)的置换、缺失或插入而引起的 DNA 序列多态性。为了与自发突变区分,SNP 的定义通常要求其在群体中的发生频率不低于 1%。人类基因组中估计存在超过 1 亿个 SNP,它们平均每 100 到 300 个碱基就会出现一个。SNP 不仅决定了人类在表型上的个体差异(如肤色、身高等),更是全基因组关联分析(GWAS)的基础,广泛应用于疾病易感性评估、药物基因组学研究及法医学鉴定。
分子机制:单碱基变异的多样效应
SNP 的产生源于 DNA 复制时的自发错误或理化因素导致的损害。根据其在基因组中的位置,SNP 会产生迥异的生物学后果:
- 转换与颠换:转换(Transition)指同型碱基间的替换(如 C-T),颠换(Transversion)指异型碱基间的替换(如 C-A)。由于化学结构的相似性,转换的发生频率约为颠换的两倍。
- 编码区 SNP (cSNP):
- 非编码区 SNP:大多位于内含子或调控区(如启动子、增强子)。它们可能通过干扰转录因子结合位点或剪接位点,精细调节基因的表达丰度,这是大多数复杂疾病(如糖尿病、高血压)易感性的分子基础。
临床景观:SNP 与精准医学应用
| 应用维度 | 核心逻辑 | 代表性案例 |
|---|---|---|
| 疾病易感性 | 通过 GWAS 识别与特定疾病高度关联的 SNP 位点。 | APOE ε4 等位基因 (SNP) 与 阿尔茨海默病 风险显著相关。 |
| 药物基因组学 | SNP 影响药物代谢酶或受体的活性。 | CYP2C19 SNP 决定了患者对 氯吡格雷 的代谢速率。 |
| 多基因风险评分 (PRS) | 综合数千个微效 SNP 的权重,计算个体的综合病发风险。 | 用于心血管疾病和某些癌症的早期分风险预防。 |
| 个体身份鉴定 | 利用 SNP 在人群中的分布差异进行血缘或祖源分析。 | 法医学中对于高度降解样本的亲缘关系判定。 |
技术策略:从大规模发现到功能验证
SNP 的研究已从单纯的“点位识别”跨越到“机制解析”阶段:
- 高通量检测平台:SNP 芯片(如 Illumina Global Screening Array)可一次性检测数十万到数百万个已知 SNP,是目前大规模群体研究的首选。而 全基因组测序 (WGS) 则能发现罕见的低频变异。
- 连锁不平衡 (LD):由于重组率的局限,相邻的 SNP 往往倾向于共同遗传。利用 单倍型(Haplotype)块的概念,研究者可以通过检测少数几个“标签 SNP”来推断整个区域的遗传信息。
- 功能性验证:利用 CRISPR/Cas9 进行碱基编辑,可以在细胞或动物模型中精准模拟特定 SNP,直接观察其对表型或信号通路的影响。
关键相关概念
学术参考文献与权威点评
[1] Sachidanandam R, et al. (2001). A map of human genome sequence variation containing 1.42 million single nucleotide polymorphisms. Nature. 409(6822):928-33. [Academic Review]
[权威点评]:该文献标志着人类首张高密度 SNP 图谱的诞生,彻底改变了复杂疾病遗传学研究。
[2] Collins FS, et al. (1998). A DNA polymorphism discovery resource for research on human genetic variation. Genome Research.
[核心价值]:定义了 SNP 发现的资源框架,是后续 dbSNP 数据库建设的理论基石。
[3] Visscher PM, et al. (2017). 10 years of GWAS discovery: biology, function, and interpretation. American Journal of Human Genetics.
[权威点评]:总结了利用 SNP 进行疾病关联分析的十年成就,探讨了从统计关联到生物功能的转化路径。