外显子测序

来自医学百科

外显子测序(Whole Exome Sequencing, WES)是一种利用高通量测序技术,专门针对基因组中编码蛋白质的区域(即外显子)进行序列测定的策略。虽然外显子区域仅占人类全基因组的约 1-2%(约 30Mb),但却包含了约 85% 的已知致病突变。通过序列捕获技术将外显子 DNA 从复杂的基因组中富集出来进行深度测序,WES 成为了发现孟德尔遗传病致病基因和癌症体细胞突变最高效、最具性价比的手段,填补了全基因组测序(WGS)高成本和基因芯片(Array)低分辨率之间的空白。

外显子测序
Whole Exome Sequencing (点击展开)
"大海捞针"式的精准捕获
英文缩写 WES
覆盖范围 ~1-2% 基因组 (编码区)
核心技术 液相杂交捕获 (Capture)
数据量 通常 6-12 Gb (100X)
核心优势 高性价比 (Cost-Effective)
首个应用 米勒综合征 (2010)

技术原理:捕获与富集 (Capture & Enrich)

与全基因组测序(WGS)直接测序所有 DNA 不同,WES 增加了一个关键的“富集”步骤。

步骤 操作描述 目的
1. 打断 (Fragmentation) 利用超声波将基因组 DNA 打断成 150-300bp 的片段,并加上接头 (Adapters)。 构建文库。
2. 杂交 (Hybridization) 加入设计好的、带有生物素标记的RNA探针(Probes)。这些探针与外显子区域互补配对。 特异性识别目标区域。
3. 捕获 (Capture) 加入链霉亲和素磁珠,磁珠通过结合生物素,将“探针-外显子 DNA”复合物从溶液中“钓”出来。 物理分离目标 DNA。
4. 洗脱与测序 洗去未结合的内含子和非编码区 DNA,将富集到的外显子 DNA 进行 PCR 扩增并上机测序。 获得序列信息。

巅峰对决:WES vs. WGS

为什么不直接测全基因组?

尽管 全基因组测序 (WGS) 成本在下降,但 WES 依然占据临床主流,主要基于“二八定律”:

  • 测序深度 (Depth): 同样的成本,WES 可以测到 100X-200X 的深度,而 WGS 通常只有 30X。对于检测癌症样本中低频的体细胞突变,高深度的 WES 更具优势。
  • 数据存储: WES 数据量仅为 WGS 的 1/10,分析和存储成本大幅降低。
  • 临床解释: 目前医学界对非编码区(Introns/Intergenic regions)突变的解释能力有限,WES 聚焦于功能明确的蛋白编码区,临床解读更直接。
       WES高深度聚焦与WGS广覆盖对比

WES 的局限性 (盲区)

  • 结构变异 (SV) 难检测: 由于是捕获短片段,WES 很难检测大片段的缺失、重复或倒位。
  • 捕获偏差: GC 含量高的区域探针杂交效率低,导致覆盖不均(Drop-out)。
  • 非编码区缺失: 无法检测增强子、启动子或深度内含子区域的致病突变。
       学术参考文献
       

[1] Ng SB, Turner EH, Robertson PD, et al. (2009). Targeted capture and massively parallel sequencing of 12 human exomes. Nature. 2009;461(7261):272-276.
[概念验证]:Jay Shendure 团队首次证明 WES 技术的可行性,并不仅限于理论。

[2] Ng SB, Buckingham KJ, ..., Shendure J, Bamshad MJ. (2010). Exome sequencing identifies the cause of a mendelian disorder. Nature Genetics. 2010;42(1):30-35.
[临床里程碑]:历史上首次利用 WES 技术成功发现了一种罕见单基因病(米勒综合征)的致病基因 DHODH,开启了罕见病诊断的新纪元。

[3] Bamshad MJ, Ng SB, Bigham AW, et al. (2011). Exome sequencing as a tool for Mendelian disease gene discovery. Nature Reviews Genetics. 2011;12(11):745-755.
[权威综述]:系统总结了 WES 在孟德尔遗传病发现中的策略和优势。

           外显子测序 (WES) · 知识图谱
上级技术 高通量测序 (NGS) • 基因组学
商业试剂 Agilent SureSelect • Roche NimbleGen • Twist Bioscience
应用领域 罕见病诊断肿瘤新抗原筛选 • 家系分析 (Trio analysis)
核心逻辑 二八定律:测 1% 的区域,解 85% 的问题