次世代测序

来自医学百科
183.241.161.14讨论2026年3月9日 (一) 16:42的版本 (建立内容为“<div style="padding: 0 4%; line-height: 1.8; color: #1e293b; font-family: 'Helvetica Neue', Helvetica, 'PingFang SC', Arial, sans-serif; background-color: #ffffff…”的新页面)
(差异) ←上一版本 | 最后版本 (差异) | 下一版本→ (差异)

次世代测序(Next-Generation Sequencing, NGS),又称 高通量测序(High-Throughput Sequencing),是 分子生物学基因组学 领域的一项革命性技术。与第一代 Sanger 测序 每次只能读取一条 DNA 片段的极低通量不同,NGS 引入了“大规模平行测序(Massively Parallel Sequencing)”的理念,能够在单次运行中同时测序数百万到数十亿条 DNARNA 片段。这一技术的突破,将人类完成 全基因组 的成本从人类基因组计划时的 30 亿美元骤降至如今的几百美元。在 临床肿瘤学 中,NGS 是 精准医学 的绝对基石:通过对肿瘤组织的 靶向基因 Panel 或外周血的 ctDNA 进行极高深度的测序,医生可以一次性筛查出所有的 点突变基因扩增基因融合 以及评估 TMB。这为 靶向治疗 提供了不可或缺的 伴随诊断 依据,彻底将癌症治疗从传统的“解剖学分类(如肺癌、胃癌)”推向了“分子分型(如 EGFR 突变型、HER2 扩增型)”的新纪元。

Next-Generation Sequencing
Massively Parallel Sequencing
NGS 流动槽与荧光信号读取原理
核心测序原理 边合成边测序 (SBS)
信号捕获方式 可逆终止荧光 / 半导体离子
典型读长 (Read) 短读长 (75 - 300 bp)
数据产出通量 百 Gb 甚至 Tb 级别 / 每次运行
最强临床应用 伴随诊断 / NIPT
下游分析依赖 生物信息学 (Bioinformatics)

技术原理:从单分子到海量数据的“桥式工厂”

以全球市场占有率最高的 Illumina 平台为例,NGS 的核心工作流程是一场极其精密的光学、流体学与生物化学的协奏曲,主要分为三个核心步骤:


  • 文库构建 (Library Preparation): 提取待测样本(如肿瘤切片或血液)的基因组 DNA,利用超声波或酶切将其随机打断成 200-500 bp 的短片段。随后在片段两端连接上特定的已知序列(称为 Adapter),并在接头中引入像条形码一样的 Barcode,以允许在同一批次中混合测序多个患者的样本。
  • 克隆扩增与簇生成 (Cluster Generation): 将构建好的文库加载到布满互补引物的玻璃载片(Flow Cell)上。单根 DNA 链会弯曲与邻近的引物结合,在聚合酶作用下进行“Bridge PCR”。经过数十个循环的扩增,原本极其微弱的单个 DNA 分子被局部复制成了由成千上万个相同序列组成的“DNA Cluster”,从而将光信号放大了数千倍,达到光学仪器可捕捉的阈值。
  • 边合成边测序 (Sequencing by Synthesis, SBS): 测序反应加入带有四种不同颜色荧光标记、且 3' 端被化学基团封闭的 dNTPs。每次循环中,DNA聚合酶 只能掺入一个碱基(因为 3'端被封闭)。机器扫描并记录数千万个簇发出的荧光颜色(判读出 A/T/C/G)。随后,化学试剂切除荧光基团和 3'端保护基团,开启下一个碱基的掺入循环。

临床应用:重塑疾病的诊疗边界

测序策略级别 技术覆盖广度与深度 典型临床应用场景
全基因组测序
(WGS)
无偏差地测定人类全部的 30 亿个碱基对(包括非编码区)。虽然广度最大,但受限于成本,其读取深度(Coverage)通常较低(约 30X)。 筛查未知的 罕见遗传病、发现新的大型 复杂染色体重排
全外显子组测序
(WES)
利用探针捕获仅占基因组 1.5% 的蛋白质编码区(外显子)。性价比高,深度可达 100X-200X,能捕获绝大多数致病性功能突变。 评估 TMB 以指导 PD-1 免疫治疗,新生儿复杂疾病确诊。
靶向基因 Panel
(Targeted Sequencing)
仅测序几十到几百个已知与癌症高度相关的特定基因(如 EGFR, ALK, BRAF)。由于范围极小,测序深度可达 1000X 甚至 10000X,对微小频率突变的敏感度极高。 伴随诊断(匹配特定靶向药)、ctDNA 检测 及极早期的肿瘤复发监测。

应用工程:从数据汪洋到医疗决策

解析生命密码的数字新基建

  • 生物信息学与变异检出 (Bioinformatics Pipeline): NGS 仪器产出的是包含数亿条短序列的“生数据”(FASTQ 文件)。必须通过强大的计算集群,将这些短序列像拼图一样 比对 (Alignment) 到人类参考基因组上,然后通过统计算法进行 Variant Calling,找出样本中存在的 SNP 或插入缺失(Indel)。
  • 临床注释与可操作突变 (Actionable Mutations): 找出的变异必须经过极为严谨的临床数据库比对(如 ClinVar 或 OncoKB)。肿瘤学家只关心那些驱动癌症且“可成药(Actionable)”的突变(例如发现携带 BRAF V600E突变,即可直接开具维莫非尼)。对于无药可治的“变异意义不明 (VUS)”突变,则不作为用药指导。
  • 动态监控网络 (液体活检追踪): 在癌症治疗过程中,通过 NGS 定期对患者血液中的 ctDNA 进行极高深度测序,可以比传统影像学(如 CT 扫描)提前数月发现肿瘤耐药的 克隆演化 轨迹,使医生能够及时更换下一代 靶向抗癌药

关键相关概念

  • 桑格测序 (Sanger Sequencing): 第一代测序技术。利用双脱氧核苷酸(ddNTP)终止反应原理。虽然通量极低且成本高昂,但其准确率高达 99.99%,至今仍被作为验证 NGS 所发现突变结果的“金标准”。
  • 第三代测序 (Third-Generation Sequencing, TGS): 也被称为 单分子测序(如 PacBio 的 SMRT 技术和 Oxford Nanopore 的纳米孔技术)。不需要扩增步骤,直接读取单根 DNA 分子。它的核心优势是能提供超过 10,000 bp 的“超长读长”,能够轻松跨越基因组中高度重复的区域,弥补了 NGS 短读长难以拼接的先天缺陷。
  • 肿瘤突变负荷 (Tumor Mutational Burden, TMB): 通过 NGS 测得的肿瘤基因组每百万个碱基(Mb)中包含的体细胞突变总数。TMB 越高,意味着癌细胞表面会产生越多的 新生抗原 (Neoantigens),越容易被免疫系统识别,这类患者对 免疫检查点抑制剂 的响应率往往极高。
       学术参考文献 [Academic Review]
       

[1] Bentley, D. R., Balasubramanian, S., Swerdlow, H. P., ..., & Smith, D. R. (2008). Accurate whole human genome sequencing using reversible terminator chemistry. Nature. 456(7218), 53-59.
[底层技术奠基]:这是 NGS 发展史上的绝对里程碑文献。Illumina 的核心科学家团队在此文中首次详细披露了基于“可逆终止化学物”的边合成边测序(SBS)底层逻辑,宣告了高通量、低成本的人类全基因组测序时代的正式降临。

[2] Metzker, M. L. (2010). Sequencing technologies—the next generation. Nature Reviews Genetics. 11(1), 31-46.
[全景技术综述]:极其系统地横向对比了包括 454 焦磷酸测序、Illumina SBS 以及 ABI SOLiD 在内的各大 NGS 平台的生化原理、文库构建策略以及短读长在信息学拼接上面临的核心挑战,是基因组学领域的必读经典。

[3] Zehir, A., Benayed, R., Shah, R. H., ..., & Berger, M. F. (2017). Mutational landscape of metastatic cancer revealed from prospective clinical sequencing of 10,000 patients. Nature Medicine. 23(6), 703-713.
[临床转化巅峰]:由纪念斯隆-凯特琳癌症中心(MSKCC)发表。报告了著名的 MSK-IMPACT 靶向测序 Panel 在超过一万名实体瘤患者中的临床应用结果,直接证明了 NGS 如何将肿瘤的突变图谱切实转化为挽救生命的靶向治疗决策。

           次世代测序 (NGS) · 生化检测与临床工程图谱
核心测序技术迭代 桑格测序 (第一代) • SBS (NGS主流) • 长读长单分子测序 (第三代)
测序广度与层级 WGS (全基因组)WES (全外显子组)靶向 Panel (高深度)
临床诊断与治疗接轨 ctDNA无创检测TMB评估突变检出 (Variant Calling)