SBS
SBS(Sequencing by Synthesis,边合成边测序)是主导当今二代测序 (NGS) 市场的核心技术范式。其基本原理是利用 DNA聚合酶 在体外合成 DNA 互补链,并通过检测每次核苷酸掺入(Incorporation)所释放的特定信号(如荧光、氢离子、焦磷酸)来确定序列信息。
与基于连接反应的 SBL (Sequencing by Ligation, 如 SOLiD) 和基于物理信号的纳米孔测序不同,SBS 依赖于生化反应的循环效率。根据是否使用阻断基团,SBS 可细分为两大流派:循环可逆终止 (CRT)(如 Illumina, MGI)和 单核苷酸添加 (SNA)(如 Ion Torrent, 454)。目前,全球超过 90% 的基因组数据均由 SBS 技术产生。
技术双雄:暂停 vs 连续
虽然都属于 SBS,但不同平台在“如何控制合成速度”上采取了截然不同的策略:
| 策略 | 循环可逆终止 (CRT) | 单核苷酸添加 (SNA) |
|---|---|---|
| 原理 | 使用 可逆终止子。每次强制只延伸 1 个碱基,然后暂停、成像、切除保护基团。 | 使用天然 dNTP。通过限制底物供给(每次只加一种 dNTP,如先加 A,再加 C)来控制。 |
| 优点 | 解决均聚物问题。即使是 AAAAA,也必须分 5 个循环读取。准确度高。 | 速度快,化学反应简单(无切割步骤)。 |
| 缺点 | 随着循环数增加,切割不完全会导致 Phasing。测序慢。 | 无法物理阻断。遇到 AAAAA 会一次性合成完,导致Indel错误。 |
| 代表 | Illumina, 华大智造 | Ion Torrent, Roche 454 |
误差模型:相位失衡 (Phasing)
在 SBS 中,DNA 簇(Cluster)中的成千上万个分子本应“齐步走”。但由于化学反应效率不可能达到 100%,部分分子会掉队或抢跑,这种现象称为 Phasing/Pre-phasing,是限制 NGS 读长的物理极限。
- Phasing (滞后): 3' 阻断基团未被切除,或聚合酶未能结合。该分子停留在第 $N$ 步,而大部队进入 $N+1$ 步。
- Pre-phasing (超前): 3' 阻断基团存在缺陷或过早脱落,导致在一个循环中连续延伸了 2 个碱基。该分子进入 $N+2$ 步。
- 后果: 随着循环进行,信号中的“噪音”越来越大,导致测序读段(Read)末端的质量值(Q-score)急剧下降。
相关概念:生物信息学中的 SBS
值得注意的是,在肿瘤基因组学和生物信息学领域,SBS 也是 Single Base Substitution(单碱基替换)的常用缩写。
● COSMIC Signatures: Alexanrov 等人定义的“突变特征”(Mutational Signatures)通常以 SBS 开头(如 SBS1 代表衰老相关特征,SBS3 代表 HRD 相关特征)。在阅读文献时需根据上下文区分是“测序技术”还是“突变类型”。
学术参考文献 [Academic Review]
[1] Fuller CW, et al. (2009). The challenges of sequencing by synthesis. Nature Biotechnology.
[点评]:经典综述,深入探讨了 SBS 的酶学动力学、核苷酸化学修饰以及信号检测中的物理限制。
[2] Margulies M, et al. (2005). Genome sequencing in microfabricated high-density picolitre reactors. Nature.
[点评]:454 测序(焦磷酸测序)的原始论文,标志着 SBS 技术(SNA 流派)在下一代测序中的首次大规模应用。
[3] Alexandrov LB, et al. (2020). The repertoire of mutational signatures in human cancer. Nature.
[点评]:关于单碱基替换 (SBS) 突变特征的权威文献,提醒读者注意 SBS 在生物信息学中的另一重含义。