文库构建

文库构建（Library Preparation），是所有 NGS（高通量测序） 流程中连接原始生物样本（DNA 或 RNA）与精密测序仪器的绝对核心前置工程。测序仪无法直接读取动辄长达数千万碱基对的天然 染色体，也无法抓取没有特定分子“把手”的核酸片段。因此，文库构建的本质，就是通过一系列极其精密的 体外生化反应，将天然核酸“改造”成测序仪能够识别、固定并放大的标准化格式。这一标准流程通常包括 DNA片段化、末端修复、加A尾、接头连接（Adapter Ligation）以及 PCR扩增 五大步骤。随着 精准医疗 的深化，文库构建技术已从最初的纯物理打断，进化出了利用 Tn5 转座酶 实现一步法建库的 微量建库技术；而在对抗 MRD 等超低频突变的 液体活检 中，更是引入了 UMI（唯一分子标识符） 来彻底消除 DNA聚合酶 带来的扩增背景噪音。毫不夸张地说，文库构建质量的优劣，直接决定了最终 生物信息学 数据的真实性、覆盖度以及临床诊断的生死存亡。

Library Prep

NGS Upstream Engineering (点击展开)

核心结构：靶序列与 Y 型接头

工艺定位	核酸提取与上机测序的桥梁
起始底物	gDNA, cDNA, cfDNA
核心修饰酶	T4 DNA连接酶, Klenow片段
关键外源组件	Adapter, Index条码
质控 (QC) 仪器	Qubit, Agilent 2100
纯化方式	AMPure XP 磁珠分选
前沿技术派系	Tn5转座酶建库, 探针杂交捕获

分子改造机制：将天然核酸变为“测序弹药”

标准的末端修饰建库法（如 Illumina TruSeq 体系）是一个极具工程美学的多步酶促反应过程。每一步都必须严格控制反应时间与磁珠纯化比例，以防止样品丢失或污染：

第一步：片段化 (Fragmentation)。 完整的 人类参考基因组 长达 30 亿 bp。必须利用超声波破碎仪（Covaris 机械打断）或非特异性内切酶将其打碎成 150-500 bp 的短片段，以适应目前的 短读长测序（Short-read sequencing） 平台。物理打断产生的切口通常是不平齐的。
第二步：末端修复与加A尾 (End Repair & A-Tailing)。 利用 T4 DNA聚合酶 和 PNK 将打断后参差不齐的 DNA 末端补平，并在 5' 端加上磷酸基团。随后，利用 Taq聚合酶 无 3'->5' 外切活性的特点，在平末端的 3' 处悬突添加一个孤立的脱氧腺嘌呤（A碱基）。
第三步：Y型接头连接 (Adapter Ligation)。 这是最堪称魔法的一步。人工合成的 测序接头 是一种特殊的 Y 型双链 DNA，其一端是平齐的带有突出“T”碱基的末端，通过经典的 T-A 配对原理 和 DNA连接酶 与上一步的靶片段缝合。接头中不仅包含了能固定到测序芯片（Flow Cell）上的 P5/P7 序列，还包含了测序引物结合位点。
第四步：PCR扩增与条码富集 (PCR Amplification & Indexing)。 由于前面几步不可避免地会造成样本损失，通常需要进行 10-15 个循环的 高保真 PCR 进行富集。在这一步中，扩增引物还会将具有唯一标识的 Index 条码序列 引入接头。这使得上百个不同患者的样本可以在同一个反应槽中混合测序（Multiplexing），随后在 生信分析 阶段再通过识别条码各自拆分。

临床应用场景：针对不同靶点的定制捕获

临床测序目标	文库构建的特殊改良策略	指导的诊断与临床意义
全外显子组测序 (WES Target Capture)	在完成基础建库后，将文库与带有生物素标记的、专为人类基因组所有编码区（约 2 万个基因）设计的 RNA 探针混合杂交。随后用链霉亲和素磁珠将这些探针连同靶序列一起“钓”出来，洗去占基因组 99% 的非编码垃圾序列。	极大降低了测序成本，深度增加，是诊断儿童罕见单基因病的黄金标准流程。
转录组测序 (RNA-Seq Library Prep)	由于人体样本中 95% 以上是无用的 rRNA。建库第一步必须使用 Oligo(dT) 磁珠特异性抓取带有 Poly(A) 尾巴的成熟 mRNA，随后通过逆转录酶将其转化为稳定的 cDNA，再进入正常的片段化加接头流程。	量化基因表达水平，发现融合基因，是现代肿瘤微环境研究和发现新药物靶点的核心技术。
液体活检与超深度测序 (ctDNA / UMI Tech)	血液中的 ctDNA 本身就是片段化的。由于肿瘤突变频率极低（<0.1%），必须在接头上附带一段随机碱基序列（UMI）。	利用 UMI，生信软件可以将 PCR 扩增引入的假突变彻底剔除，实现极高的信噪比，精确追踪晚期癌症的耐药突变。

工程学革命：追求微量、极速与单细胞化

下一代建库化学：彻底摆脱物理打断

Tn5 转座酶建库 (Tagmentation)： 传统的建库流程需要耗费数十小时，且样本损失率极高。科学家利用被改造的高活性 Tn5 转座酶（如 Illumina 的 Nextera 试剂盒）。这种酶能够像导弹一样随机降落到 DNA 上，在切断 DNA 的同时，将转座序列（测序接头的一部分）瞬间插入并连接到断端上。这一革命性技术将片段化、末端修复和接头连接合并为短短 5 分钟的一步反应，使得检测单细胞级别的微量 DNA 成为可能。
单细胞液滴建库 (Droplet-based scRNA-seq)： 在 单细胞测序（如 10x Genomics）中，文库构建被搬到了微米级别的油包水液滴中进行。每个细胞被单独包裹进一个包含带有极长条形码凝胶珠的液滴中。在液滴内部完成细胞裂解和逆转录，从而在物理上保证了最终测出的每条 RNA 序列，都能够精确追溯到它来源于数万个细胞中的哪一个具体细胞。

核心相关概念

分子条形码 (UMI)： Unique Molecular Identifier。建库时引入的一段高度随机的寡核苷酸短序列（通常为 8-10 个碱基）。它的作用类似于给每一个初始的原始 DNA 分子贴上一个全球唯一的“身份证号”。在后续的 PCR 扩增中，无论这个分子被复制了多少次，它们都带着相同的 UMI，从而在数据分析时被折叠归一，完美去除了 PCR 偏好性和扩增错误。
磁珠纯化 (SPRI Beads)： Solid Phase Reversible Immobilization 磁珠。文库构建过程中不可或缺的清洗工具。磁珠表面包裹着羧基，在高浓度 PEG 缓冲液中能够特异性地结合特定长度以上的 DNA 片段。通过调整 PEG 的浓度比例，可以精确筛选出所需长度的文库片段（Size Selection），同时彻底洗去多余的酶、引物二聚体和游离核苷酸。
接头二聚体 (Adapter Dimer)： 建库过程中的核心死敌。如果在接头连接后纯化不彻底，两个游离的接头可能会互相连接形成只有几十碱基长的“接头二聚体”。在后续 PCR 和上机测序时，这些短小精悍的二聚体会占据巨大的扩增优势，像野草一样疯狂消耗测序仪的数据通量，导致有效靶序列的数据产出断崖式下跌。

       学术参考文献 [Academic Review]

[1] Head SR, Komori HK, LaMere SA, et al. (2014). Library construction for next-generation sequencing: overviews and challenges. BioTechniques. 56(2): 61-77.
[系统性综述]：该文献是关于高通量测序文库构建领域引用率最高的经典综述之一。详细拆解了从超声波打断到末端修复、TA 克隆连接的底层酶促动力学机制，并深入探讨了接头二聚体、PCR 扩增偏倚（GC Bias）对测序覆盖度的深远影响。

[2] Kivioja T, Vähärautio A, Karlsson K, et al. (2011). Counting absolute numbers of molecules using unique molecular identifiers. Nature Methods. 9(1):72-74.
[核心技术突破]：这是将分子条形码（UMI）正式引入高通量测序体系的开山之作。研究团队极具天才地证明了通过在建库阶段引入随机条码池，可以在后续的数据分析中实现对原始 RNA 分子的“绝对定量计数”，奠定了如今所有单细胞测序和超灵敏液体活检的技术基石。

[3] Adey A, Morrison HG, Asan, et al. (2010). Rapid, low-input, low-bias construction of shotgun fragment libraries by high-density in vitro transposition. Genome Biology. 11(12):R119.
[工程学革命]：这是一篇彻底颠覆了传统文库构建格局的文献。作者首次报道了利用经过高活性改造的 Tn5 转座酶复合体（即后来的 Nextera 技术核心），在短短数分钟内同步完成 DNA 片段化和接头连接的原理，直接开启了表观遗传学（如 ATAC-seq）和微量建库的新时代。

           文库构建 · 知识图谱

经典标准化流程	DNA片段化 • 末端修复 / 加A尾 • 接头连接
革命性衍生技术	Tn5 碎裂建库 • UMI 降噪 • 杂交捕获富集
测序接头关键组件	Flow Cell 结合区 (P5/P7) • 测序引物位点 • 样本标签 (Index)

匿名

搜索

文库构建

名字空间

更多

页面选项

目录

分子改造机制：将天然核酸变为“测序弹药”

临床应用场景：针对不同靶点的定制捕获

工程学革命：追求微量、极速与单细胞化

下一代建库化学：彻底摆脱物理打断

核心相关概念

导航

导航

功能菜单

Wiki工具

Wiki工具

匿名

搜索

文库构建

分子改造机制：将天然核酸变为“测序弹药”

临床应用场景：针对不同靶点的定制捕获

工程学革命：追求微量、极速与单细胞化

下一代建库化学：彻底摆脱物理打断

核心相关概念

导航

Wiki工具

页面工具