GWAS

来自医学百科
77921020讨论 | 贡献2025年12月27日 (六) 01:29的版本 (建立内容为“<div style="padding: 0 5%; line-height: 1.6; color: #334155;"> '''全基因组关联分析'''(Genome-Wide Association Study,简称 **GWAS**),是一种通…”的新页面)
(差异) ←上一版本 | 最后版本 (差异) | 下一版本→ (差异)

全基因组关联分析(Genome-Wide Association Study,简称 **GWAS**),是一种通过对大规模人群病例组(Cases)与对照组(Controls)的全身全基因组范围内的遗传变异——主要是**单核苷酸多态性**(SNPs)进行扫描,从而鉴定与复杂疾病或性状相关的遗传位点的研究方法。GWAS 改变了人类对多基因复杂疾病(如糖尿病、癌症、心血管病)遗传基础的认知,是**精准医疗**、**药物靶点**发现及**多基因风险评分**(PRS)开发的基石。

GWAS
Genome-Wide Association Study
       G
全基因组扫描,关联分析
研究对象 复杂疾病性状
核心标记 SNPs (单核苷酸多态性)
统计指标 P值胜算比 (OR)
显著性阈值 $$5 \times 10^{-8}$$
可视化工具 曼哈顿图

核心逻辑:从关联到遗传图谱[编辑 | 编辑源代码]

GWAS 的基本假设是“**常见疾病-常见变异**”(Common Disease-Common Variant, CD-CV)。它不针对特定的基因,而是通过全基因组范围的非偏见扫描来寻找信号。


  • **病例-对照研究 (Case-Control Study)**:将人群按是否患有目标疾病分组,比较两组间 SNP 等位基因频率的显著差异。
  • **连锁不平衡 (Linkage Disequilibrium, LD)**:GWAS 并不一定直接检测到致病位点,而是通过检测与致病位点处于连锁状态的“标签 SNPs”来定位关联区域。
  • **统计功效 (Power)**:由于 SNP 数量极大(常达百万级),必须进行严厉的**多重假设检验校正**(如 Bonferroni 校正),以避免假阳性。

标准工作流[编辑 | 编辑源代码]

  1. **样本收集与表型定义**:确保人群来源的一致性,减少**群体分层**(Population Stratification)带来的误差。
  2. **基因分型 (Genotyping)**:使用 **DNA芯片** 或全基因组测序获取每个个体的 SNPs 信息。
  3. **质量控制 (QC)**:剔除呼叫率低、不符合 **哈代-温伯格平衡**(HWE)或杂合度异常的位点及样本。
  4. **基因型填充 (Imputation)**:利用参考单倍型库(如 1000 Genomes)推测未直接检测到的 SNP 位点,提高覆盖度。
  5. **统计关联分析**:对每个位点进行回归分析,计算 $p$ 值和效应量(Beta 或 OR 值)。

结果可视化:曼哈顿图与分位图[编辑 | 编辑源代码]

GWAS 的核心产出通常通过以下图形展示:

  • **曼哈顿图 (Manhattan Plot)**:横轴表示染色体位置,纵轴表示 $-\log_{10}(P)$ 值。每一个点代表一个 SNP。越过 $5 \times 10^{-8}$ 阈值横线的“塔尖”即为显著关联位点。
  • **QQ 图 (Quantile-Quantile Plot)**:比较观测到的 $p$ 值分布与理论原假设(零假设)下的分布。偏离对角线的上翘部分代表真实的遗传关联信号。

临床应用与学术价值[编辑 | 编辑源代码]

GWAS 在精准医学中的关键贡献
应用方向 技术内涵 (Rationale) 实际产出 (Outcome)
**疾病风险预测** 整合数千个微效效应位点的权重。 构建**多基因风险评分** (PRS)。
**药物研发** 识别导致特定疾病通路的关键基因。 发现新型**药物靶点**(如 PCSK9 抑制剂)。
**因果推断** 将 SNPs 作为工具变量。 进行**孟德尔随机化** (MR) 分析。

挑战与局限:遗传力的“迷失”[编辑 | 编辑源代码]

  • **缺失的遗传力 (Missing Heritability)**:GWAS 发现的显著位点往往只能解释疾病遗传力的一小部分,这可能是由于**罕见变异**、结构变异或基因-环境相互作用(GxE)未被充分捕获。
  • **相关性并非因果性**:GWAS 信号仅代表关联,需结合 **功能基因组学**(如 CRISPR 筛选、eQTL 分析)来验证致病基因。
  • **群体偏差**:早期 GWAS 多基于欧洲人群,导致其结果在非欧洲群体中的预测效能受限。

参考文献[编辑 | 编辑源代码]

  • [1] **Visscher PM, et al**. **10 years of GWAS discovery: utilizing joint analysis of 250,000 individuals.** American Journal of Human Genetics. 2017.
  • [2] **Welter D, et al**. **The NHGRI-EBI GWAS Catalog of published genome-wide association studies.** Nucleic Acids Research. 2014.
  • [3] **Tam V, et al**. **Benefits and limitations of genome-wide association studies.** Nature Reviews Genetics. 2019.