外显子测序
外显子测序(Whole Exome Sequencing, WES)是一种利用高通量测序技术,专门针对基因组中编码蛋白质的区域(即外显子)进行序列测定的策略。虽然外显子区域仅占人类全基因组的约 1-2%(约 30Mb),但却包含了约 85% 的已知致病突变。通过序列捕获技术将外显子 DNA 从复杂的基因组中富集出来进行深度测序,WES 成为了发现孟德尔遗传病致病基因和癌症体细胞突变最高效、最具性价比的手段,填补了全基因组测序(WGS)高成本和基因芯片(Array)低分辨率之间的空白。
技术原理:捕获与富集 (Capture & Enrich)
与全基因组测序(WGS)直接测序所有 DNA 不同,WES 增加了一个关键的“富集”步骤。
| 步骤 | 操作描述 | 目的 |
|---|---|---|
| 1. 打断 (Fragmentation) | 利用超声波将基因组 DNA 打断成 150-300bp 的片段,并加上接头 (Adapters)。 | 构建文库。 |
| 2. 杂交 (Hybridization) | 加入设计好的、带有生物素标记的RNA探针(Probes)。这些探针与外显子区域互补配对。 | 特异性识别目标区域。 |
| 3. 捕获 (Capture) | 加入链霉亲和素磁珠,磁珠通过结合生物素,将“探针-外显子 DNA”复合物从溶液中“钓”出来。 | 物理分离目标 DNA。 |
| 4. 洗脱与测序 | 洗去未结合的内含子和非编码区 DNA,将富集到的外显子 DNA 进行 PCR 扩增并上机测序。 | 获得序列信息。 |
巅峰对决:WES vs. WGS
为什么不直接测全基因组?
尽管 全基因组测序 (WGS) 成本在下降,但 WES 依然占据临床主流,主要基于“二八定律”:
- 测序深度 (Depth): 同样的成本,WES 可以测到 100X-200X 的深度,而 WGS 通常只有 30X。对于检测癌症样本中低频的体细胞突变,高深度的 WES 更具优势。
- 数据存储: WES 数据量仅为 WGS 的 1/10,分析和存储成本大幅降低。
- 临床解释: 目前医学界对非编码区(Introns/Intergenic regions)突变的解释能力有限,WES 聚焦于功能明确的蛋白编码区,临床解读更直接。
WES高深度聚焦与WGS广覆盖对比
WES 的局限性 (盲区)
- 结构变异 (SV) 难检测: 由于是捕获短片段,WES 很难检测大片段的缺失、重复或倒位。
- 捕获偏差: GC 含量高的区域探针杂交效率低,导致覆盖不均(Drop-out)。
- 非编码区缺失: 无法检测增强子、启动子或深度内含子区域的致病突变。
学术参考文献
[1] Ng SB, Turner EH, Robertson PD, et al. (2009). Targeted capture and massively parallel sequencing of 12 human exomes. Nature. 2009;461(7261):272-276.
[概念验证]:Jay Shendure 团队首次证明 WES 技术的可行性,并不仅限于理论。
[2] Ng SB, Buckingham KJ, ..., Shendure J, Bamshad MJ. (2010). Exome sequencing identifies the cause of a mendelian disorder. Nature Genetics. 2010;42(1):30-35.
[临床里程碑]:历史上首次利用 WES 技术成功发现了一种罕见单基因病(米勒综合征)的致病基因 DHODH,开启了罕见病诊断的新纪元。
[3] Bamshad MJ, Ng SB, Bigham AW, et al. (2011). Exome sequencing as a tool for Mendelian disease gene discovery. Nature Reviews Genetics. 2011;12(11):745-755.
[权威综述]:系统总结了 WES 在孟德尔遗传病发现中的策略和优势。