桑格测序

来自医学百科

桑格测序(Sanger Sequencing),又称 双脱氧链终止法,是由两届诺贝尔化学奖得主 Frederick Sanger 于 1977 年发明的 第一代测序技术。作为 分子生物学 史上最伟大的技术突破之一,它通过在 DNA复制 过程中巧妙地掺入缺乏 3'-羟基的 ddNTPs,强制终止 DNA聚合酶 的延伸反应,随后利用 毛细管电泳 和激光荧光检测系统,精确读取出 DNA 序列。这一技术不仅凭借一己之力完成了耗时 13 年的宏伟工程——HGP,更在长达近四十年的时间里统治了整个基因测序领域。尽管如今在数据吞吐量上已被 NGS(高通量测序)所超越,但桑格测序凭借其极低的错误率(准确率高达 99.99%)和对长读长(500-1000 bp)的稳定解析能力,至今仍被全球医学界公认为基因突变检测与 临床诊断 的“金标准”。在现代 精准医学 流程中,它常被用于对 NGS 筛查出的复杂 点突变罕见遗传病 靶点进行最终的“一锤定音”式验证。

Sanger Sequencing
Chain Termination Method
经典的 Sanger 测序荧光峰图
技术世代 第一代测序技术
核心终止底物 ddNTP (缺 3'-OH)
分离与读取手段 毛细管电泳 / 激光激发
有效读长 (Read) 中长读长 (500 - 1000 bp)
准确率水平 > 99.99% (临床金标准)
核心临床定位 单基因遗传病确诊 / NGS 验证

分子机制:双脱氧核苷酸的“刹车”魔法

桑格测序的原理极度优雅,它巧妙地利用了 DNA 合成时的生化法则,将微观的分子复制过程转化为可被光学仪器读取的宏观长度差异:


  • 聚合反应与致命掺入: 在含有单链 DNA模板、引物和 DNA聚合酶 的反应体系中,除了加入大量的正常底物(dNTPs),还混入极少量的 ddNTPs(ddATP、ddTTP、ddCTP、ddGTP)。每种 ddNTP 标记了不同颜色的 荧光染料。由于 ddNTP 缺失了形成 磷酸二酯键 必须的 3'-羟基 (-OH),一旦 DNA聚合酶“误拿”了一个 ddNTP 并将其连接到延伸链上,整条链的延伸就会被瞬间“锁死”终止。
  • 片段文库的泊松分布: 因为正常 dNTP 和终止型 ddNTP 存在竞争,终止反应是随机发生的。最终,反应管内会生成数以百万计、长短不一的 DNA 新生链,这些链涵盖了从引物之后第 1 个碱基到第 1000 个碱基的所有可能长度,且每条链的最后一个碱基都带有代表其身份的特异性荧光。
  • 毛细管电泳与激光读取: 这些长短不一的 DNA 片段被注入极细的 聚合物毛细管 中。在电场作用下,较短的片段跑得快,较长的片段跑得慢(按长度实现了精确到单核苷酸级别的高分辨率分离)。当片段逐一经过检测窗口时,激光激发其末端的荧光基团,CCD 相机 记录下按长度排序的“红黄蓝绿”光信号,计算机将其直接翻译为 A/T/C/G 的 DNA 序列。

临床应用:精准诊断的“终审法庭”

临床应用场景 Sanger 测序的核心优势 典型应用疾病 / 靶点
单基因遗传病确诊
(Single Gene Disorders)
对于已知由特定基因或极少数明确突变位点引发的疾病,Sanger 测序成本更低、速度更快,无需复杂的生物信息学拼接。 家族性 高胆固醇血症、镰状细胞贫血、明确家族史的 BRCA 突变 检测。
NGS 结果的阳性验证
(NGS Validation)
NGS 极高通量带来的副作用是可能存在背景系统噪音或拼接错误。临床指南要求,对 NGS 发现的关键罕见突变,必须使用 Sanger 进行二次交叉验证以排除假阳性。 决定患者是否能使用极高价值 靶向抗癌药 的关键基因位点复核。
微卫星与片段分析
(Fragment Analysis)
依赖 Sanger 测序仪极其精准的毛细管电泳分离能力,不仅能读取序列,还能精确计算 STR 的重复次数。 法医学 亲子鉴定、骨髓移植后的嵌合体分析、微卫星不稳定 (MSI) 检测。

应用工程:在“高通量洪流”中坚守精准度

自动化演进与临床互补生态

  • 全自动基因分析仪 (Automated Sequencers): 现代 Sanger 测序早已告别了早期的放射性同位素和手动灌胶平板电泳。以 ABI 3730xl 等为代表的自动化毛细管电泳仪,实现了从进样、电泳、激光扫描到峰图输出的全自动流水线作业,使得单次读取长度可以极其稳定地达到 800-1000 bp。
  • 双剑合璧的临床诊断闭环: 在当前的 伴随诊断 体系中,NGS 充当“全景雷达”,负责在广袤的基因组中进行无偏差的大规模扫描;而 Sanger 测序则充当“狙击镜”,针对雷达发现的可疑致病位点进行单对单的物理级确认。两者构成了目前人类 基因测序 临床应用最坚不可摧的双重保险。
  • 长读长带来的独家优势: NGS 通常受限于极短的读长(通常 150 bp),在遇到基因组中高度同源的重复区域或 假基因 时极易发生错位拼接。而 Sanger 测序逼近 1000 bp 的连贯读长,能够直接跨越这些复杂的基因组区域,提供无懈可击的真实序列信息。

关键相关概念

  • 测序峰图 (Chromatogram): Sanger 测序的直观输出结果。屏幕上会显示连绵起伏的红、绿、蓝、黑四色波峰,分别代表 T、A、C、G。当某一个位点上出现两个高度相近、颜色不同重叠的峰时,这在临床上通常是极具价值的标志,直接代表该患者在此基因位点上存在 杂合子 (Heterozygote)
  • 人类基因组计划 (HGP): 一项规模宏大、跨越世纪的国际科学合作项目。正是依靠成千上万台 Sanger 测序仪不分昼夜地运转了长达 13 年,科学家们才在 2003 年完成了人类基因组 30 亿个碱基对序列的首次完整绘制,开启了基因组学时代。
  • 引物步移法 (Primer Walking): 在面对一段长达几千 bp(超出了单次 Sanger 读长极限)的未知序列时所采用的经典策略。先用通用引物测出一段序列,然后根据这段新测出的序列设计新的引物,继续向下游测序。如此像走路一样一步步推进,直到获得完整的全长序列。
       学术参考文献 [Academic Review]
       

[1] Sanger, F., Nicklen, S., & Coulson, A. R. (1977). DNA sequencing with chain-terminating inhibitors. Proceedings of the National Academy of Sciences. 74(12), 5463-5467.
[技术鼻祖文献]:改变人类科学史的论文。Frederick Sanger 在此文中首次详细描述了利用双脱氧核苷酸引发 DNA 链特异性终止的原理,这一发明不仅为他赢得了第二座诺贝尔化学奖,更直接催生了现代基因组学。

[2] Smith, L. M., Sanders, J. Z., Kaiser, R. J., ..., & Hood, L. E. (1986). Fluorescence detection in automated DNA sequence analysis. Nature. 321(6072), 674-679.
[自动化里程碑]:这篇文献标志着 Sanger 测序从落后的放射性同位素时代迈入现代光学时代。作者首次展示了如何利用四种不同颜色的荧光染料标记引物,从而实现了 DNA 序列分析的自动化与计算机直接读取。

[3] Lander, E. S., Linton, L. M., Birren, B., ..., & International Human Genome Sequencing Consortium. (2001). Initial sequencing and analysis of the human genome. Nature. 409(6822), 860-921.
[人类基因组计划总结]:这是分子生物学历史上最宏大工程的总结报告。文中呈现的人类基因组草图序列,其底层全部依赖于高度自动化的毛细管荧光 Sanger 测序技术所生成的海量数据拼接而成。

           桑格测序 (Sanger Sequencing) · 生化原理与应用图谱
核心生化试剂 ddNTP (终止剂) • DNA聚合酶特异性引物 • 荧光染料
物理与数字工程 毛细管电泳 (精细分离) • 激光检测器Chromatogram判读
临床与历史生态 HGP完成者明确突变诊断NGS金标准验证