SNP

来自医学百科
223.160.138.153讨论2026年4月8日 (三) 14:21的版本 (建立内容为“<div style="padding: 0 4%; line-height: 1.8; color: #1e293b; font-family: 'Helvetica Neue', Helvetica, 'PingFang SC', Arial, sans-serif; background-color: #ffffff…”的新页面)
(差异) ←上一版本 | 最后版本 (差异) | 下一版本→ (差异)

单核苷酸多态性(Single Nucleotide Polymorphism, SNP)是人类基因组中最常见的一种遗传变异形式,指在基因组水平上由单个核苷酸(A、T、C 或 G)的置换、缺失或插入而引起的 DNA 序列多态性。为了与自发突变区分,SNP 的定义通常要求其在群体中的发生频率不低于 1%。人类基因组中估计存在超过 1 亿个 SNP,它们平均每 100 到 300 个碱基就会出现一个。SNP 不仅决定了人类在表型上的个体差异(如肤色、身高等),更是全基因组关联分析(GWAS)的基础,广泛应用于疾病易感性评估、药物基因组学研究及法医学鉴定。

单核苷酸多态性 (SNP)
遗传变异基础 · 点击展开
分子特征:单碱基置换
定义频率 > 1.0% (人群)
核心数据库 dbSNP (NCBI)
变异类型 转换、颠换
检测方法 NGS, SNP 芯片, PCR
临床应用 GWAS, PRS, 药物基因组
多样性贡献 ~90% 的遗传变异

分子机制:单碱基变异的多样效应

SNP 的产生源于 DNA 复制时的自发错误或理化因素导致的损害。根据其在基因组中的位置,SNP 会产生迥异的生物学后果:

  • 转换与颠换:转换(Transition)指同型碱基间的替换(如 C-T),颠换(Transversion)指异型碱基间的替换(如 C-A)。由于化学结构的相似性,转换的发生频率约为颠换的两倍。
  • 编码区 SNP (cSNP):
    • 同义 SNP碱基改变但不改变氨基酸序列(由于密码子简并性),曾被认为无害,现发现可能影响 mRNA 稳定性和翻译效率。
    • 非同义 SNP包括错义突变(改变氨基酸)和无义突变(提前引入终止密码子),常直接导致蛋白质功能改变。
  • 非编码区 SNP:大多位于内含子或调控区(如启动子、增强子)。它们可能通过干扰转录因子结合位点或剪接位点,精细调节基因的表达丰度,这是大多数复杂疾病(如糖尿病、高血压)易感性的分子基础。

临床景观:SNP 与精准医学应用

应用维度 核心逻辑 代表性案例
疾病易感性 通过 GWAS 识别与特定疾病高度关联的 SNP 位点。 APOE ε4 等位基因 (SNP) 与 阿尔茨海默病 风险显著相关。
药物基因组学 SNP 影响药物代谢酶或受体的活性。 CYP2C19 SNP 决定了患者对 氯吡格雷 的代谢速率。
多基因风险评分 (PRS) 综合数千个微效 SNP 的权重,计算个体的综合病发风险。 用于心血管疾病和某些癌症的早期分风险预防。
个体身份鉴定 利用 SNP 在人群中的分布差异进行血缘或祖源分析。 法医学中对于高度降解样本的亲缘关系判定。

技术策略:从大规模发现到功能验证

SNP 的研究已从单纯的“点位识别”跨越到“机制解析”阶段:

  • 高通量检测平台:SNP 芯片(如 Illumina Global Screening Array)可一次性检测数十万到数百万个已知 SNP,是目前大规模群体研究的首选。而 全基因组测序 (WGS) 则能发现罕见的低频变异。
  • 连锁不平衡 (LD):由于重组率的局限,相邻的 SNP 往往倾向于共同遗传。利用 单倍型(Haplotype)块的概念,研究者可以通过检测少数几个“标签 SNP”来推断整个区域的遗传信息。
  • 功能性验证:利用 CRISPR/Cas9 进行碱基编辑,可以在细胞或动物模型中精准模拟特定 SNP,直接观察其对表型或信号通路的影响。

关键相关概念

  • GWAS (全基因组关联分析):寻找 SNP 与疾病表型之间统计学关联的标准范式。
  • 单倍型 (Haplotype):同一染色体上共同遗传的一组 SNP 组合。
  • 连锁不平衡 (LD):不同位点等位基因非随机结合的现象。
  • dbSNP:由 NCBI 维护的全球最权威的单核苷酸变异数据库。
  • 错义突变:一种由 SNP 引起氨基酸种类改变的变异类型。
  • 等位基因 (Allele):SNP 位点上存在的不同核苷酸形式(如 A 型或 G 型)。
       学术参考文献与权威点评
       

[1] Sachidanandam R, et al. (2001). A map of human genome sequence variation containing 1.42 million single nucleotide polymorphisms. Nature. 409(6822):928-33. [Academic Review]
[权威点评]:该文献标志着人类首张高密度 SNP 图谱的诞生,彻底改变了复杂疾病遗传学研究。

[2] Collins FS, et al. (1998). A DNA polymorphism discovery resource for research on human genetic variation. Genome Research.
[核心价值]:定义了 SNP 发现的资源框架,是后续 dbSNP 数据库建设的理论基石。

[3] Visscher PM, et al. (2017). 10 years of GWAS discovery: biology, function, and interpretation. American Journal of Human Genetics.
[权威点评]:总结了利用 SNP 进行疾病关联分析的十年成就,探讨了从统计关联到生物功能的转化路径。

           遗传变异解析与精准健康 · 知识图谱
关联因子 MAF (主等位基因频率)rsID编码 vs 非编码组蛋白修饰
调控层面 剪接调控转录因子结合染色质可及性表型多样性
核心数据库 ClinVarExAC/gnomADHapMap Project1000 Genomes
研究前沿 单细胞 SNP 分型稀有变异与复杂病关联 • AI 辅助致病 SNP 预测