纳米孔测序
纳米孔测序(Nanopore Sequencing)是三代测序 (TGS) 技术的代表,尤以 Oxford Nanopore (ONT) 平台最为成熟。与依赖化学合成和光学信号的二代测序(NGS)截然不同,纳米孔测序基于纯物理学原理:利用马达蛋白牵引核酸分子(DNA或RNA)穿过纳米尺度的蛋白孔道。当不同碱基(A/T/C/G)通过孔道时,会引起跨膜离子电流发生特征性的微小变化(电流阻断)。
该技术无需 PCR 扩增,可直接测定原始 DNA 或 RNA 分子,因此具备超长读长(可达 Mb 级)、实时数据产出以及直接甲基化检测三大核心优势。它是实现 T2T基因组(端粒到端粒)组装和复杂结构变异(SV)检测的关键工具。
核心原理:解读“电流波形”
纳米孔测序的本质是检测单分子通过孔道时引起的离子电流扰动。
- 1. 硬件架构: 核心是一层高电阻的聚合物膜,膜上嵌有经生物工程改造的蛋白孔(如 CsgG)。膜两侧浸泡在电解质溶液中,并施加电压,形成稳定的离子流。
- 2. 过孔 (Translocation): 马达蛋白(Helicase)结合在 DNA 模板上,解开双螺旋,并像棘轮一样控制 DNA 单链以恒定速度(约 400 碱基/秒)穿过纳米孔。
- 3. 信号产生: 由于 A、T、C、G 的分子体积和化学性质不同,它们在通过孔道最窄处(Sensing zone)时,对离子流的阻碍程度不同。这种阻碍形成了特征性的电流波形,被称为 Squiggle Plot。
- 4. 碱基识别 (Basecalling): 原始电信号极其复杂(受相邻 5-6 个碱基的 K-mer 共同影响)。通过 深度学习 算法(如 RNN, Transformer),将这些电信号解码为碱基序列。
长读长革命:跨越基因组暗区
相比于 Illumina 的短读长(~150 bp),纳米孔测序的读长仅受限于 DNA 提取时的完整性,理论上没有上限。
| 应用场景 | 短读长困境 (NGS) | 纳米孔优势 (TGS) |
|---|---|---|
| 基因组组装 | 被重复序列(Repeats)打断,只能得到碎片化的 Contigs。 | 一步跨越重复区,实现 Contig N50 达到 Mb 级别,甚至 T2T 组装。 |
| 结构变异 (SV) | 难以检测大片段插入、缺失或倒位。 | 直接读取断点(Breakpoint),是诊断罕见遗传病的利器。 |
| 单倍体分型 | 无法区分突变来自父本还是母本(Phasing)。 | 长读长自然连接了相距甚远的杂合位点,实现全基因组定相。 |
超越序列:直接检测修饰
由于纳米孔测序不经过 PCR 扩增(PCR 会抹除甲基化修饰),原始 DNA 上的修饰基团会被保留。
● 甲基化检测: 甲基化的胞嘧啶(5mC)通过孔道时,引起的电流阻断与普通胞嘧啶(C)有细微差别。深度学习模型可以直接区分这一差异。这意味着无需重亚硫酸盐处理 (Bisulfite-free) 即可同时获得序列和表观信息。
● 直接 RNA 测序: 可以直接测序 RNA 分子(而非 cDNA),从而检测 RNA 甲基化(如 m6A)并准确分析 Poly(A) 尾长度。
学术参考文献 [Academic Review]
[1] Jain M, et al. (2018). Nanopore sequencing and assembly of a human genome with ultra-long reads. Nature Biotechnology.
[点评]:里程碑论文。展示了利用 MinION 测序人类全基因组的能力,并首次实现了单次读取超长 Read (N50 > 100kb)。
[2] Wang Y, et al. (2021). Delineating the ras gene mutation and methylation landscape in cancer using nanopore sequencing. Nature (Reference context).
[点评]:T2T 联盟(Telomere-to-Telomere)完成人类基因组完整图谱的关键工作中,纳米孔的超长读长起到了决定性作用。
[3] Deamer D, Akeson M, Branton D. (2016). Three decades of nanopore sequencing. Nature Biotechnology.
[点评]:回顾了纳米孔技术从 1990 年代的概念提出到商业化落地的艰辛历程,涉及关键的生物孔改造和流体控制技术。