下一代测序技术

来自医学百科

下一代测序技术(Next-Generation Sequencing,简称 NGS),又称高通量测序(High-throughput sequencing),是自 Sanger 测序(第一代)之后,人类基因组学领域最具颠覆性的底层技术革命。与传统测序一次只能读取一条 DNA 片段不同,NGS 利用大规模平行测序的原理,能够在单次运行中同时读取数百万至数十亿条 DNA 或 RNA 片段。这项技术将人类全基因组测序的成本从 30 亿美元(人类基因组计划)呈指数级压缩至如今的数百美元,彻底推开了 精准医疗 的大门。在临床病理学中,NGS 是解构 恶性肿瘤 复杂突变网络、指导 靶向治疗 以及实施 液体活检 的绝对基础设施;而在 Geroscience长寿科技 的最前沿,NGS 则被用于测定 表观遗传时钟(DNA 甲基化测序)、解析单细胞水平的 SASP 转录组特征,以及追踪随年龄增长而发生的克隆性造血突变(CHIP)。没有 NGS,现代生物学对生命密码的解读将永远停留在“盲人摸象”的时代。

NGS Technology
Massively Parallel Sequencing (点击展开)
NGS 大规模平行测序核心流程
核心生化原理 边合成边测序 (SBS)
经典代表平台 Illumina, Ion Torrent
标志性技术特征 极高通量, 相对短读长 (Short-read)
核心应用场景 WGS, WES, RNA-Seq
临床转化里程碑 驱动 精准医疗靶向治疗
衰老科学应用 单细胞转录组学, 表观遗传测序

核心机理网络:解密生命代码的微观流水线

以目前全球市场占有率最高的 Illumina 平台(边合成边测序技术)为例,NGS 的工程化实现是一个高度集成的生化与光学交叉过程,通常分为四大严密步骤:

  • 第一步:文库构建 (Library Preparation): 基因组极其庞大,无法直接读取。首先需要用超声波或酶将长链 DNA 随机打断成短片段(如 200-500 bp)。随后,在这些片段的两端连接上极其关键的特定序列(接头 Adapter)。这些接头是后续片段锚定到测序芯片上的“挂钩”。
  • 第二步:簇生成与克隆扩增 (Cluster Generation): 将文库注入布满互补引物的流动池(Flow Cell)玻璃芯片上。单根 DNA 片段通过接头锚定后,利用“桥式 PCR(Bridge PCR)”技术在原位进行成百上千次的自我复制。最终,在芯片表面形成数百万个极其微小的、由同一序列组成的“DNA 簇(Cluster)”,以此放大光信号以便机器读取。
  • 第三步:边合成边测序 (Sequencing by Synthesis, SBS): 核心读取阶段。系统向芯片注入带有不同颜色荧光标记的四种脱氧核苷酸(A, T, C, G)。每当 DNA 聚合酶将一个正确的碱基添加到新生链上时,该碱基上的荧光基团就会发出特定颜色的光(同时阻止下一个碱基加入)。高分辨率相机拍下整块芯片的荧光照片后,化学试剂洗去阻断基团,进行下一轮合成。数百万个簇在每一次循环中同时闪烁发光,转化为海量的碱基序列(Reads)。
  • 第四步:生物信息学分析 (Bioinformatics Analysis): 机器输出的只是几十亿条杂乱无章的短片段数据。必须依赖超级计算机和专门的算法软件,将这些短序列与“人类标准参考基因组”进行比对拼接(Alignment),最终找出患者特有的突变、缺失或结构变异(Variant Calling)。

病理学临床投射:重塑疾病诊断的底层逻辑


临床医疗痛点 传统检测的盲区 NGS 带来的革命性破局
肿瘤靶向治疗盲区
(Precision Oncology)
传统的单基因 PCR 检测一次只能寻找一种突变,面对晚期癌症复杂的突变网络(如肺癌的 EGFR/ALK/ROS1 等)耗时极长且极易漏诊。 利用大 Panel 测序(如一次测 500 个癌症基因),精准找出致病驱动突变,并计算肿瘤突变负荷 (TMB) 以指导免疫治疗。
无创早期癌症筛查
(Liquid Biopsy)
影像学(CT/PET)只能发现毫米级以上的实体肿瘤,此时癌症往往已经发生微转移,错过了最佳外科根治窗口。 通过对外周血中极微量的 循环肿瘤 DNA (ctDNA) 进行极高深度的 NGS 测序,在影像学发现前数月实现癌症预警。
罕见病的诊断奥德赛
(Rare Genetic Diseases)
单基因遗传病多达 7000 种,患者往往辗转多年、花费巨大仍无法确诊病因。 采用全外显子组测序 (WES),一次性读取所有编码蛋白质的基因区域,极大提高了罕见病和儿科遗传病的极速确诊率。

临床干预与长寿策略:解码与延缓衰老的数字基盘

重塑抗衰老医学的数据引擎

  • 标定生物学年龄 (Epigenetic Clocks): 传统的日历年龄无法反映机体的真实磨损。长寿医学利用 NGS 技术进行全基因组亚硫酸氢盐测序(WGBS),精准读取数百万个 CpG 位点的甲基化状态。以此构建的 表观遗传时钟 能够极其精准地计算出一个人的真实“生物学年龄”,并作为验证 二甲双胍Senolytics 等干预手段是否真的“拨慢了衰老”的绝对黄金标准。
  • 驱动新型临床试验设计: 现代针对复杂衰老网络或肿瘤的 主研究方案(如 伞形试验篮子试验)完全建立在 NGS 提供的基建之上。没有 NGS 高效的大规模基因分型,就无法将极其异质化的老年患者或癌症患者精准分流到不同的靶向治疗臂中。
  • 解析免疫系统与肠道微生态衰老: 通过对老年人外周血进行单细胞 RNA 测序(scRNA-seq),科学家首次在分子层面看清了 炎性衰老 时巨噬细胞的异常转录图谱;同时,利用 16S rRNA 测序技术解码肠道宏基因组,揭示了伴随衰老而来的共生菌群多样性崩塌,为益生菌干预和粪菌移植(FMT)提供了精准靶点。

核心相关概念

  • 全基因组测序 (WGS) & 全外显子组测序 (WES): WGS 是读取完整的 30 亿个碱基对(包括无编码区);而 WES 仅通过探针捕获并测序基因组中约占 1.5% 但负责编码所有蛋白质的“外显子”区域。WES 在极其讲究性价比的临床诊断中应用最广。
  • 多组学 (Multi-omics): NGS 不仅能测定 DNA 序列(基因组学),还可以测定 RNA 的表达量(转录组学)、染色质的开放状态(表观基因组学)。将这些海量数据叠加,构成了现代精准医疗的系统生物学底座。
  • 第三代测序技术 (Third-Generation Sequencing): 为弥补 NGS(二代)读长过短(碎片化拼图难)的缺陷而诞生的单分子长读段测序(如 PacBio, Oxford Nanopore)。它们能够一次性读取数万碱基的超长链,极其适合解析复杂的基因组结构变异和端粒区域。
       学术参考文献 [Academic Review]
       

[1] Metzker ML. (2010). Sequencing technologies - the next generation. Nature Reviews Genetics. 11(1):31-46.
[领域技术基石]:生物学史上最经典的综述之一。极其详尽地解构了包括边合成边测序(SBS)、焦磷酸测序在内的多种 NGS 平台的核心生化机制、物理光学系统以及它们是如何在通量与成本上彻底碾压传统 Sanger 测序的。

[2] Goodwin S, McPherson JD, McCombie WR. (2016). Coming of age: ten years of next-generation sequencing technologies. Nature Reviews Genetics. 17(6):333-351.
[十年演进与转化]:全面总结了 NGS 问世十年来的爆发式演进。详细探讨了生物信息学算法在处理海量短片段数据(Big Data)时的挑战,并展望了长读长测序(第三代)与单细胞测序如何进一步拓展精准医学的边界。

[3] Horvath S. (2013). DNA methylation age of human tissues and cell types. Genome Biology. 14(10):R115.
[长寿科学的核爆级应用]:衰老科学领域的里程碑式论文。Steve Horvath 凭借极其庞大的多组织 DNA 甲基化测序(基于 NGS 衍生的芯片数据)构建了史上第一个全组织适用的“表观遗传时钟”,直接确立了 NGS 技术在测量衰老速度中的绝对统治地位。

           下一代测序技术 (NGS) · 知识图谱
核心生产流水线 文库构建 ➔ 桥式 PCR 簇扩增 ➔ 边合成边测序 (SBS) ➔ 生物信息学分析
临床工程化破局 驱动 精准医疗 ⟷ 实现癌症 靶向治疗 分型与 液体活检
长寿靶向应用 支撑 多组学 解析衰老网络 ⟷ 读取计算 表观遗传时钟