全基因组测序

来自医学百科

全基因组测序(Whole Genome Sequencing,简称 **WES**),是一种利用**高通量测序**技术测定生物体完整基因组序列的过程。与仅关注蛋白质编码区的**全外显子组测序**(WES)不同,WGS 的覆盖范围包括了编码区、非编码区(如内含子、基因间区)以及调控元件(如启动子、增强子)。它是目前获取个体遗传信息最详尽的技术手段,被视为**精准医疗**、**复杂疾病研究**及**演化生物学**领域的“终极诊断工具”。

全基因组测序
Whole Genome Sequencing
       
全维度覆盖,生命全代码
测序范围 全基因组 (~3GB)
覆盖比例 > 99%
核心能力 结构变异识别
科学逻辑 完整性、全息性
技术演进 NGS $\rightarrow$ 三代测序

技术逻辑:跨尺度的信息捕捉[编辑 | 编辑源代码]

WGS 的核心优势在于其“非偏见性”(Unbiased)和“全覆盖性”,能够捕捉到其他测序手段无法识别的遗传信号。

  • **非编码区挖掘**:虽然非编码 DNA 曾被认为是“垃圾 DNA”,但 WGS 证明了其中的**调控元件**(如 miRNA, lincRNA)对基因表达的精确时空调控至关重要。
  • **结构变异 (SV) 识别**:WGS 是检测大规模**倒位**、**易位**及**拷贝数变异**(CNV)的最有效手段。由于物理覆盖的连续性,它可以重构复杂的染色体结构重排。
  • **均一性优势**:WGS 无需经历 WES 的探针杂交捕获步骤,从而避免了捕获不均导致的测序偏好性,提供更真实、更均一的读长分布。

核心对比:WGS 与 WES 的差异化定位[编辑 | 编辑源代码]

全基因组 (WGS) 与 全外显子组 (WES) 技术对照表
比较维度 **全基因组测序 (WGS)** **全外显子组测序 (WES)**
**覆盖范围** ~3,000,000,000 bp (100%) ~30,000,000 bp (约 1.5%)
**非编码区变异** 全面覆盖。 基本缺失。
**典型深度** 30x ~ 50x (常规临床)。 100x ~ 200x。
**致病变异检出** 可识别深层内含子及复杂 SV。 仅限编码区及其相邻剪接点。

医学应用场景[编辑 | 编辑源代码]

  • **临床遗难疾病诊断**:对于 WES 阴性但具有显著遗传倾向的**罕见病**患者,WGS 能通过识别深层内含子变异或调控区缺陷提供额外 $10\% \sim 20\%$ 的检出率。
  • **肿瘤进化研究**:WGS 可用于分析肿瘤的**突变特征**(Mutational Signatures)和全基因组范围内的**非稳态演化**,辅助开发个性化新生抗原疫苗。
  • **药理基因组学**:更全面地扫描影响药物反应的变异,不仅限于代谢酶基因,还包括远程调控元件。
  • **新生儿疾病筛查**:作为下一代筛查工具,WGS 能够一次性检测成千上万种单基因遗传病风险。

挑战与局限性[编辑 | 编辑源代码]

  • **数据解读负担**:WGS 产生海量的“**临床意义不明变异**”(VUS),尤其是在非编码区,其功能性验证依然是当前的巨大挑战。
  • **计算与存储成本**:单人 WGS 数据量通常在 100GB 以上,对**生物信息学**存储与并行计算能力提出了极高要求。
  • **伦理与隐私**:由于包含了个体的全部遗传信息(包括亲缘关系、演化背景及未来健康预测),WGS 的**数据安全**与知情同意程序至关重要。

参考文献[编辑 | 编辑源代码]

  • [1] **Lander ES, et al.** **Initial sequencing and analysis of the human genome.** Nature. 2001.
    • 【评析】**:人类基因组计划的奠基之作,定义了 WGS 的基准参考。
  • [2] **1000 Genomes Project Consortium**. **A global reference for human genetic variation.** Nature. 2015.
  • [3] **Taylor JC, et al.** **Factors influencing the contribution of whole-genome sequencing to medical diagnosis.** Nature Genetics. 2015.