下一代测序

来自医学百科
185.180.13.101讨论2026年3月6日 (五) 12:30的版本 (建立内容为“<div style="padding: 0 4%; line-height: 1.8; color: #1e293b; font-family: 'Helvetica Neue', Helvetica, 'PingFang SC', Arial, sans-serif; background-color: #ffffff…”的新页面)
(差异) ←上一版本 | 最后版本 (差异) | 下一版本→ (差异)

下一代测序(Next-Generation Sequencing, NGS),又称 高通量测序(High-Throughput Sequencing)或大规模平行测序,是人类 基因组学分子诊断 历史上最具颠覆性的技术革命。与传统的、每次只能读取一条片段的第一代 Sanger测序 不同,NGS 依托微流控芯片与微型化光学捕获技术,能够在单次运行中同时对数百万到数十亿条 DNARNA 分子进行 边合成边测序(Sequencing by Synthesis)。 这种极端的并行化使得测序成本以超越 摩尔定律 的速度暴跌:从当年耗资 30 亿美元、历时十余年的 人类基因组计划,缩减至如今不到几百美元、仅需一天的常规检测。在现代 精准医疗 中,NGS 已经彻底重塑了临床诊疗的底层逻辑:从孕期的 NIPT(无创产前检测),到针对儿童罕见遗传病的 WES,再到肿瘤学中通过 液体活检 追踪 ctDNA 并指导 靶向治疗。可以说,NGS 是连接基础生物学代码与现代人类 健康寿命 之间最核心的“分子雷达”与数据引擎。

NGS / High-Throughput
Massively Parallel Sequencing (点击展开)
边合成边测序 (SBS) 的微观光学捕获
技术分类 第二代 核酸测序 技术
核心原理 大规模平行扩增 + 边合成边测序
文库关键酶 DNA连接酶, DNA聚合酶
数据产出量 几 Gb 至数十 Tb / 运行
读长 (Read Length) 短读长为主 (75bp - 300bp)
生信输出格式 FASTQ -> BAM -> VCF
核心临床应用 NIPT, 肿瘤分型, 罕见病

分子与工程机制:亿万分子的“并行大合唱”

以目前占据绝对市场统治地位的 Illumina 平台为例,其底层工程逻辑突破了传统的毛细管电泳限制,主要通过以下三个精妙的生化步骤实现海量吞吐:

  • 文库构建 (Library Preparation): 首先利用超声波或 限制性内切酶 将提取的超长 基因组DNA 随机打断成 200-500bp 的短片段。随后,通过 DNA连接酶 在这些短片段的两端加上特定的人工接头(Adapters)。这些接头不仅包含用于后续附着芯片的序列,还包含能够区分不同患者样本的“条形码(Barcode / Index)”。
  • 桥式 PCR 与簇生成 (Bridge PCR & Clonal Amplification): 将文库注入铺满寡核苷酸探针的玻璃芯片(Flow Cell)中。DNA 片段的两端接头会分别与芯片上的探针杂交弯曲成“桥”状,随后在芯片表面进行局部的 桥式 PCR。这一步将单个 DNA 分子在原地物理扩增出上千份相同的拷贝,形成一个肉眼不可见但光学仪器可以捕捉的“信号簇(Cluster)”。
  • 边合成边测序 (Sequencing by Synthesis, SBS): 反应体系中加入四种带有不同荧光标记且被“可逆终止基团”锁死的 dNTPs。由于终止基团的存在,聚合酶每次只能延伸一个碱基。此时,高分辨率激光扫描整个芯片,记录下数亿个簇发出的荧光颜色(红黄蓝绿代表 A/T/C/G)。记录完成后,化学试剂切除荧光基团和终止基团,继续延伸下一个碱基。如此循环往复。

临床诊断映射:重塑精准医学的分子雷达

临床应用场景 底层测序逻辑与靶点 宏观疾病防控与指南地位
无创产前检测
(NIPT)
孕妇外周血中含有游离的胎儿 DNA(cffDNA)。通过极其浅度(约 0.1x)的全基因组测序,并利用生物信息学统计各染色体的 Reads 比例,精准计算是否存在染色体剂量异常。 已成为全球产科筛查 唐氏综合征(T21)、爱德华氏综合征(T18)的绝对主力,大幅降低了 羊膜穿刺术 带来的流产风险。
肿瘤伴随诊断
(Oncology Panel)
利用数百个癌症相关基因组成的 Panel(如 FoundationOne CDx),一次性深度测序寻找 点突变基因扩增 和融合基因。同时计算 TMBMSI 状态。 NCCN指南 推荐的晚期 非小细胞肺癌 确诊后必做的首个检查,直接决定患者能否使用 靶向药(如 EGFR 抑制剂)或 免疫疗法
罕见病诊断诊断
(Rare Diseases Diagnostics)
通过 WES 仅仅捕获并测序基因组中 1% 的编码蛋白区域(外显子组),在已知致病基因中大海捞针,寻找导致患儿表型异常的 单基因致病突变 彻底终结了许多罕见病家庭长达数年的“诊断漫游(Diagnostic Odyssey)”,为 SMA 等疾病的早期基因治疗争取了关键窗口期。

生信分析与转化前沿:海量数据的“淘金”

从 A/T/C/G 文本到临床诊断报告

  • 生信分析主流程 (Bioinformatics Pipeline): 测序仪吐出的原始数据是数十亿条乱序的短片段代码(储存在 FASTQ 文件中)。强大的服务器首先要切除无关接头,然后利用 BWA 等算法将这些短片段“拼图”一样比对(Mapping)到标准 人类参考基因组(如 GRCh38) 上(生成 BAM 文件)。最后通过变异检测算法(Variant Calling)挑出与参考基因组不同的碱基,写入 VCF 文件供临床医生解读。
  • 液体活检与 MRD 追踪 (Liquid Biopsy): 当肿瘤细胞死亡时,会将携带有致病突变的 ctDNA 释放到血液中。利用超高深度的 NGS(测序深度达到 10,000x 以上)并在接头上加入分子条形码(UMI)以消除聚合酶错误,医生只需抽取一管外周血,就能极其灵敏地监测 MRD,在影像学发现肿瘤复发的前几个月就拉响警报。

核心相关概念

  • 全基因组测序 (WGS): Whole Genome Sequencing。不加任何过滤,直接对包含内含子、调控区和非编码区的全部 30 亿个碱基对进行彻底测序。虽然成本最高,但能发现复杂的大规模 染色体结构变异(SV)
  • 测序深度 / 覆盖度 (Depth / Coverage): 测序结果的可靠性指标。由于测序是一个概率抽样事件,基因组上的同一个位点被多条不同的 Read 重复测到的次数称为“深度(如 30x 或 500x)”。深度越深,找出的低频突变(如肿瘤样本中只占 1% 的突变细胞)就越准确,假阳性越低。
  • 第三代测序 (Third-Generation Sequencing): NGS(二代)的致命弱点是“读长极短”,导致在拼接基因组中的长串重复序列时如同盲人摸象。以 PacBio(单分子实时测序)和 Oxford Nanopore(纳米孔测序)为代表的三代测序,无需 PCR 扩增,可直接读取长达数万到百万 bp 的超长 DNA 片段,正在与 NGS 形成互补的完美拼图。
       学术参考文献 [Academic Review]
       

[1] Bentley DR, Balasubramanian S, Swerdlow HP, et al. (2008). Accurate whole human genome sequencing using reversible terminator chemistry. Nature. 456(7218):53-59.
[核心技术奠基]:这篇绝对经典的里程碑文献首次详细公布了基于 Solexa(后被 Illumina 收购)可逆终止子化学和桥式 PCR 的高通量边合成边测序原理。该方法直接奠定了统治当今全球 90% 以上测序市场的底层技术工程学基础。

[2] Margulies M, Egholm M, Altman WE, et al. (2005). Genome sequencing in microfabricated high-density picolitre reactors. Nature. 437(7056):376-380.
[概念破局]:标志着基因组测序正式进入“下一代”的破冰之作。基于 454 生命科学公司的焦磷酸测序技术,首次展示了摆脱毛细管和细菌克隆,利用微乳液 PCR(emPCR)实现数十万条 DNA 大规模平行测序的恐怖威力。

[3] Goodwin S, McPherson JD, McCombie WR. (2016). Coming of age: ten years of next-generation sequencing technologies. Nature Reviews Genetics. 17(6):333-351.
[系统演进综述]:由全球顶尖遗传学专家撰写的万字长文,系统性梳理了 NGS 技术的发展史,深入对比了各大平台的生化优劣势,并全面前瞻了其在临床诊断、单细胞组学以及长读长(三代)测序夹击下的进化路线图。

           下一代测序 · 知识图谱
核心生化步骤 文库构建 (加接头) • 桥式PCR (簇生成) • 边合成边测序
临床诊断阵列 NIPT (防唐氏) • WES (罕见病) • 伴随诊断 (肿瘤靶向用药)
生信与前沿转化 FASTQ to VCF液体活检 (ctDNA 追踪)