<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="zh-Hans-CN">
	<id>https://www.yiliao.com/index.php?action=history&amp;feed=atom&amp;title=GTF%E6%A0%BC%E5%BC%8F</id>
	<title>GTF格式 - 版本历史</title>
	<link rel="self" type="application/atom+xml" href="https://www.yiliao.com/index.php?action=history&amp;feed=atom&amp;title=GTF%E6%A0%BC%E5%BC%8F"/>
	<link rel="alternate" type="text/html" href="https://www.yiliao.com/index.php?title=GTF%E6%A0%BC%E5%BC%8F&amp;action=history"/>
	<updated>2026-04-21T15:09:20Z</updated>
	<subtitle>本wiki的该页面的版本历史</subtitle>
	<generator>MediaWiki 1.35.1</generator>
	<entry>
		<id>https://www.yiliao.com/index.php?title=GTF%E6%A0%BC%E5%BC%8F&amp;diff=317065&amp;oldid=prev</id>
		<title>185.180.13.101：建立内容为“&lt;div style=&quot;padding: 0 4%; line-height: 1.8; color: #1e293b; font-family: 'Helvetica Neue', Helvetica, 'PingFang SC', Arial, sans-serif; background-color: #ffffff…”的新页面</title>
		<link rel="alternate" type="text/html" href="https://www.yiliao.com/index.php?title=GTF%E6%A0%BC%E5%BC%8F&amp;diff=317065&amp;oldid=prev"/>
		<updated>2026-03-06T05:52:39Z</updated>

		<summary type="html">&lt;p&gt;建立内容为“&amp;lt;div style=&amp;quot;padding: 0 4%; line-height: 1.8; color: #1e293b; font-family: &amp;#039;Helvetica Neue&amp;#039;, Helvetica, &amp;#039;PingFang SC&amp;#039;, Arial, sans-serif; background-color: #ffffff…”的新页面&lt;/p&gt;
&lt;p&gt;&lt;b&gt;新页面&lt;/b&gt;&lt;/p&gt;&lt;div&gt;&amp;lt;div style=&amp;quot;padding: 0 4%; line-height: 1.8; color: #1e293b; font-family: 'Helvetica Neue', Helvetica, 'PingFang SC', Arial, sans-serif; background-color: #ffffff; max-width: 1200px; margin: auto;&amp;quot;&amp;gt;&lt;br /&gt;
&lt;br /&gt;
    &amp;lt;div style=&amp;quot;margin-bottom: 30px; border-bottom: 1.2px solid #e2e8f0; padding-bottom: 25px;&amp;quot;&amp;gt;&lt;br /&gt;
        &amp;lt;p style=&amp;quot;font-size: 1.1em; margin: 10px 0; color: #334155; text-align: justify;&amp;quot;&amp;gt;&lt;br /&gt;
            &amp;lt;strong&amp;gt;[[GTF格式]]&amp;lt;/strong&amp;gt;（Gene Transfer Format，基因转移格式），是 &amp;lt;strong&amp;gt;[[生物信息学]]&amp;lt;/strong&amp;gt; 与 &amp;lt;strong&amp;gt;[[基因组学]]&amp;lt;/strong&amp;gt; 领域中用于描述和注释基因组特征的绝对核心文件标准。如果说 &amp;lt;strong&amp;gt;[[人类参考基因组|FASTA格式]]&amp;lt;/strong&amp;gt; 提供的是绵延 30 亿个 A/T/C/G 字母的“裸露地形图”，那么 GTF 格式就是覆盖在这张地图上的高精度“GPS 导航坐标字典”。 它本质上是一个以制表符（Tab）分隔的纯文本文件，精确记录了基因组上每一个 &amp;lt;strong&amp;gt;[[基因]]&amp;lt;/strong&amp;gt;、&amp;lt;strong&amp;gt;[[转录本]]&amp;lt;/strong&amp;gt;、&amp;lt;strong&amp;gt;[[外显子|外显子（Exon）]]&amp;lt;/strong&amp;gt; 和 &amp;lt;strong&amp;gt;[[编码序列|CDS区（编码序列）]]&amp;lt;/strong&amp;gt; 的物理起始与终止位置、正负链方向以及基因名称等属性。在现代 &amp;lt;strong&amp;gt;[[精准医疗]]&amp;lt;/strong&amp;gt; 的 &amp;lt;strong&amp;gt;[[下一代测序|NGS]]&amp;lt;/strong&amp;gt; 数据分析中，GTF 格式是不可或缺的基石：在 &amp;lt;strong&amp;gt;[[RNA-Seq|转录组测序（RNA-Seq）]]&amp;lt;/strong&amp;gt; 中，计数软件必须依赖 GTF 才能将测序片段（Reads）准确分配给特定基因以计算 &amp;lt;strong&amp;gt;[[基因表达|表达量]]&amp;lt;/strong&amp;gt;；在 &amp;lt;strong&amp;gt;[[全外显子测序|WES]]&amp;lt;/strong&amp;gt; 或肿瘤靶向测序中，变异注释软件也是依据 GTF 才能判定某个 &amp;lt;strong&amp;gt;[[单核苷酸多态性|SNP]]&amp;lt;/strong&amp;gt; 是否落在关键的 &amp;lt;strong&amp;gt;[[蛋白质|蛋白]]&amp;lt;/strong&amp;gt; 编码区，从而引发 &amp;lt;strong&amp;gt;[[错义突变]]&amp;lt;/strong&amp;gt; 或 &amp;lt;strong&amp;gt;[[无义突变]]&amp;lt;/strong&amp;gt;。目前，临床与科研中最权威的标准化 GTF 文件主要由 &amp;lt;strong&amp;gt;[[Ensembl数据库|Ensembl]]&amp;lt;/strong&amp;gt; 和 &amp;lt;strong&amp;gt;[[GENCODE项目|GENCODE]]&amp;lt;/strong&amp;gt; 联盟负责维护与定期更新。&lt;br /&gt;
        &amp;lt;/p&amp;gt;&lt;br /&gt;
    &amp;lt;/div&amp;gt;&lt;br /&gt;
&lt;br /&gt;
    &amp;lt;div class=&amp;quot;medical-infobox mw-collapsible mw-collapsed&amp;quot; style=&amp;quot;width: 320px; border: 1.2px solid #bae6fd; border-radius: 12px; background-color: #ffffff; box-shadow: 0 8px 20px rgba(0,0,0,0.05); overflow: hidden; float: right; margin-left: 20px; margin-bottom: 20px;&amp;quot;&amp;gt;&lt;br /&gt;
        &lt;br /&gt;
        &amp;lt;div style=&amp;quot;padding: 15px; color: #1e40af; background: linear-gradient(135deg, #e0f2fe 0%, #bae6fd 100%); text-align: center; cursor: pointer;&amp;quot;&amp;gt;&lt;br /&gt;
            &amp;lt;div style=&amp;quot;font-size: 1.2em; font-weight: bold; letter-spacing: 1px;&amp;quot;&amp;gt;GTF Format&amp;lt;/div&amp;gt;&lt;br /&gt;
            &amp;lt;div style=&amp;quot;font-size: 0.75em; opacity: 0.85; margin-top: 4px;&amp;quot;&amp;gt;Genomic Annotation Standard (点击展开)&amp;lt;/div&amp;gt;&lt;br /&gt;
        &amp;lt;/div&amp;gt;&lt;br /&gt;
        &lt;br /&gt;
        &amp;lt;div class=&amp;quot;mw-collapsible-content&amp;quot;&amp;gt;&lt;br /&gt;
            &amp;lt;div style=&amp;quot;padding: 20px; text-align: center; background-color: #f8fafc;&amp;quot;&amp;gt;&lt;br /&gt;
                &amp;lt;div style=&amp;quot;display: inline-block; background: #ffffff; border: 1px solid #e2e8f0; border-radius: 8px; padding: 15px; box-shadow: 0 4px 10px rgba(0,0,0,0.04); margin: 5px;&amp;quot;&amp;gt;&lt;br /&gt;
                    &amp;lt;div style=&amp;quot;width: 120px; height: 120px; background: #f1f5f9; border-radius: 4px; display: flex; align-items: center; justify-content: center; overflow: hidden; padding: 15px;&amp;quot;&amp;gt;&lt;br /&gt;
                        &lt;br /&gt;
                    &amp;lt;/div&amp;gt;&lt;br /&gt;
                &amp;lt;/div&amp;gt;&lt;br /&gt;
                &amp;lt;div style=&amp;quot;font-size: 0.8em; color: #64748b; margin-top: 10px; font-weight: 600;&amp;quot;&amp;gt;标准 9 列坐标与注释架构&amp;lt;/div&amp;gt;&lt;br /&gt;
            &amp;lt;/div&amp;gt;&lt;br /&gt;
&lt;br /&gt;
            &amp;lt;table style=&amp;quot;width: 100%; border-spacing: 0; border-collapse: collapse; font-size: 0.82em;&amp;quot;&amp;gt;&lt;br /&gt;
                &amp;lt;tr&amp;gt;&lt;br /&gt;
                    &amp;lt;th style=&amp;quot;text-align: left; padding: 8px 12px; background-color: #f1f5f9; color: #475569; border-bottom: 1px solid #e2e8f0; width: 42%;&amp;quot;&amp;gt;数据类型&amp;lt;/th&amp;gt;&lt;br /&gt;
                    &amp;lt;td style=&amp;quot;padding: 8px 12px; border-bottom: 1px solid #e2e8f0; color: #1e40af;&amp;quot;&amp;gt;Tab 制表符分隔文本 (TSV)&amp;lt;/td&amp;gt;&lt;br /&gt;
                &amp;lt;/tr&amp;gt;&lt;br /&gt;
                &amp;lt;tr&amp;gt;&lt;br /&gt;
                    &amp;lt;th style=&amp;quot;text-align: left; padding: 8px 12px; background-color: #f1f5f9; color: #475569; border-bottom: 1px solid #e2e8f0;&amp;quot;&amp;gt;核心结构&amp;lt;/th&amp;gt;&lt;br /&gt;
                    &amp;lt;td style=&amp;quot;padding: 8px 12px; border-bottom: 1px solid #e2e8f0; color: #b91c1c;&amp;quot;&amp;gt;严格的 &amp;lt;strong&amp;gt;9 列&amp;lt;/strong&amp;gt; 格式&amp;lt;/td&amp;gt;&lt;br /&gt;
                &amp;lt;/tr&amp;gt;&lt;br /&gt;
                &amp;lt;tr&amp;gt;&lt;br /&gt;
                    &amp;lt;th style=&amp;quot;text-align: left; padding: 8px 12px; background-color: #f1f5f9; color: #475569; border-bottom: 1px solid #e2e8f0;&amp;quot;&amp;gt;关键层级特征&amp;lt;/th&amp;gt;&lt;br /&gt;
                    &amp;lt;td style=&amp;quot;padding: 8px 12px; border-bottom: 1px solid #e2e8f0; color: #0f172a;&amp;quot;&amp;gt;&amp;lt;strong&amp;gt;[[基因|gene]]&amp;lt;/strong&amp;gt; &amp;gt; &amp;lt;strong&amp;gt;[[转录本|transcript]]&amp;lt;/strong&amp;gt; &amp;gt; &amp;lt;strong&amp;gt;[[外显子|exon]]&amp;lt;/strong&amp;gt;/&amp;lt;strong&amp;gt;[[CDS区|CDS]]&amp;lt;/strong&amp;gt;&amp;lt;/td&amp;gt;&lt;br /&gt;
                &amp;lt;/tr&amp;gt;&lt;br /&gt;
                &amp;lt;tr&amp;gt;&lt;br /&gt;
                    &amp;lt;th style=&amp;quot;text-align: left; padding: 8px 12px; background-color: #f1f5f9; color: #475569; border-bottom: 1px solid #e2e8f0;&amp;quot;&amp;gt;强制性属性键&amp;lt;/th&amp;gt;&lt;br /&gt;
                    &amp;lt;td style=&amp;quot;padding: 8px 12px; border-bottom: 1px solid #e2e8f0; color: #0f172a;&amp;quot;&amp;gt;&amp;lt;i&amp;gt;gene_id&amp;lt;/i&amp;gt; 与 &amp;lt;i&amp;gt;transcript_id&amp;lt;/i&amp;gt;&amp;lt;/td&amp;gt;&lt;br /&gt;
                &amp;lt;/tr&amp;gt;&lt;br /&gt;
                &amp;lt;tr&amp;gt;&lt;br /&gt;
                    &amp;lt;th style=&amp;quot;text-align: left; padding: 8px 12px; background-color: #f1f5f9; color: #475569; border-bottom: 1px solid #e2e8f0;&amp;quot;&amp;gt;坐标基准&amp;lt;/th&amp;gt;&lt;br /&gt;
                    &amp;lt;td style=&amp;quot;padding: 8px 12px; border-bottom: 1px solid #e2e8f0; color: #0f172a;&amp;quot;&amp;gt;以 1 为基准 (1-based)&amp;lt;/td&amp;gt;&lt;br /&gt;
                &amp;lt;/tr&amp;gt;&lt;br /&gt;
                &amp;lt;tr&amp;gt;&lt;br /&gt;
                    &amp;lt;th style=&amp;quot;text-align: left; padding: 8px 12px; background-color: #f1f5f9; color: #475569; border-bottom: 1px solid #e2e8f0;&amp;quot;&amp;gt;权威来源库&amp;lt;/th&amp;gt;&lt;br /&gt;
                    &amp;lt;td style=&amp;quot;padding: 8px 12px; border-bottom: 1px solid #e2e8f0; color: #0f172a;&amp;quot;&amp;gt;&amp;lt;strong&amp;gt;[[GENCODE项目|GENCODE]]&amp;lt;/strong&amp;gt;, &amp;lt;strong&amp;gt;[[Ensembl数据库|Ensembl]]&amp;lt;/strong&amp;gt;, RefSeq&amp;lt;/td&amp;gt;&lt;br /&gt;
                &amp;lt;/tr&amp;gt;&lt;br /&gt;
                &amp;lt;tr&amp;gt;&lt;br /&gt;
                    &amp;lt;th style=&amp;quot;text-align: left; padding: 8px 12px; background-color: #f1f5f9; color: #475569;&amp;quot;&amp;gt;生信核心用途&amp;lt;/th&amp;gt;&lt;br /&gt;
                    &amp;lt;td style=&amp;quot;padding: 8px 12px; color: #166534;&amp;quot;&amp;gt;&amp;lt;strong&amp;gt;[[RNA-Seq|转录组定量]]&amp;lt;/strong&amp;gt; / &amp;lt;strong&amp;gt;[[突变注释|突变临床注释]]&amp;lt;/strong&amp;gt;&amp;lt;/td&amp;gt;&lt;br /&gt;
                &amp;lt;/tr&amp;gt;&lt;br /&gt;
            &amp;lt;/table&amp;gt;&lt;br /&gt;
        &amp;lt;/div&amp;gt;&lt;br /&gt;
    &amp;lt;/div&amp;gt;&lt;br /&gt;
&lt;br /&gt;
    &amp;lt;h2 style=&amp;quot;background: #f1f5f9; color: #0f172a; padding: 10px 18px; border-radius: 0 6px 6px 0; font-size: 1.25em; margin-top: 40px; border-left: 6px solid #0f172a; font-weight: bold;&amp;quot;&amp;gt;语法结构：解码基因组的 9 列“GPS 坐标”&amp;lt;/h2&amp;gt;&lt;br /&gt;
&lt;br /&gt;
    &amp;lt;p style=&amp;quot;margin: 15px 0; text-align: justify;&amp;quot;&amp;gt;&lt;br /&gt;
        GTF（通常演进为 GTF2.2 规范）对格式的要求极其严格。文件中的每一行都代表基因组上的一个独立特征（Feature），并被雷打不动地分为 9 个字段：&lt;br /&gt;
    &amp;lt;/p&amp;gt;&lt;br /&gt;
&lt;br /&gt;
    &amp;lt;ul style=&amp;quot;padding-left: 25px; color: #334155;&amp;quot;&amp;gt;&lt;br /&gt;
        &amp;lt;li style=&amp;quot;margin-bottom: 12px;&amp;quot;&amp;gt;&amp;lt;strong&amp;gt;第 1-3 列 (定位与分类)：&amp;lt;/strong&amp;gt; &amp;lt;code&amp;gt;seqname&amp;lt;/code&amp;gt;（&amp;lt;strong&amp;gt;[[人类染色体|染色体编号]]&amp;lt;/strong&amp;gt;，如 chr1）、&amp;lt;code&amp;gt;source&amp;lt;/code&amp;gt;（注释来源，如 HAVANA 团队手工注释或 &amp;lt;strong&amp;gt;[[Ensembl数据库|Ensembl]]&amp;lt;/strong&amp;gt; 自动预测）、&amp;lt;code&amp;gt;feature&amp;lt;/code&amp;gt;（特征类型，必须是 gene、transcript、&amp;lt;strong&amp;gt;[[外显子|exon]]&amp;lt;/strong&amp;gt;、&amp;lt;strong&amp;gt;[[CDS区|CDS]]&amp;lt;/strong&amp;gt;、start_codon 或 stop_codon 之一）。&amp;lt;/li&amp;gt;&lt;br /&gt;
        &amp;lt;li style=&amp;quot;margin-bottom: 12px;&amp;quot;&amp;gt;&amp;lt;strong&amp;gt;第 4-6 列 (精确坐标与评分)：&amp;lt;/strong&amp;gt; &amp;lt;code&amp;gt;start&amp;lt;/code&amp;gt; 和 &amp;lt;code&amp;gt;end&amp;lt;/code&amp;gt; 提供了该特征在染色体上的精确起止物理位置（1-based 闭区间）。&amp;lt;code&amp;gt;score&amp;lt;/code&amp;gt; 通常在现代文件中用 &amp;lt;code&amp;gt;.&amp;lt;/code&amp;gt; 占位，表示没有相关的统计评分。&amp;lt;/li&amp;gt;&lt;br /&gt;
        &amp;lt;li style=&amp;quot;margin-bottom: 12px;&amp;quot;&amp;gt;&amp;lt;strong&amp;gt;第 7-8 列 (方向与翻译框)：&amp;lt;/strong&amp;gt; &amp;lt;code&amp;gt;strand&amp;lt;/code&amp;gt; 标明该基因是在正链（&amp;lt;code&amp;gt;+&amp;lt;/code&amp;gt;）还是负链（&amp;lt;code&amp;gt;-&amp;lt;/code&amp;gt;）上。&amp;lt;code&amp;gt;frame&amp;lt;/code&amp;gt; 专为 &amp;lt;strong&amp;gt;[[编码序列|CDS区]]&amp;lt;/strong&amp;gt; 设计（取值为 0, 1 或 2），指示 &amp;lt;strong&amp;gt;[[密码子]]&amp;lt;/strong&amp;gt; 在 &amp;lt;strong&amp;gt;[[核糖体翻译|翻译]]&amp;lt;/strong&amp;gt; 时的起始阅读框偏移量，这对于预测 &amp;lt;strong&amp;gt;[[移码突变]]&amp;lt;/strong&amp;gt; 至关重要。&amp;lt;/li&amp;gt;&lt;br /&gt;
        &amp;lt;li style=&amp;quot;margin-bottom: 12px;&amp;quot;&amp;gt;&amp;lt;strong&amp;gt;第 9 列 (多维属性字典)：&amp;lt;/strong&amp;gt; &amp;lt;code&amp;gt;attributes&amp;lt;/code&amp;gt; 是 GTF 最具价值也是最复杂的一列。它包含一系列以分号分隔的键值对。其中 &amp;lt;code&amp;gt;gene_id&amp;lt;/code&amp;gt; 和 &amp;lt;code&amp;gt;transcript_id&amp;lt;/code&amp;gt; 是绝对强制存在的标签。此外还会包含 &amp;lt;code&amp;gt;gene_name&amp;lt;/code&amp;gt;（如 &amp;lt;strong&amp;gt;[[TP53基因|TP53]]&amp;lt;/strong&amp;gt;）、&amp;lt;code&amp;gt;gene_biotype&amp;lt;/code&amp;gt;（指明它是 &amp;lt;strong&amp;gt;[[蛋白质|蛋白编码基因]]&amp;lt;/strong&amp;gt; 还是 &amp;lt;strong&amp;gt;[[长非编码RNA|lncRNA]]&amp;lt;/strong&amp;gt;）等极其丰富的生物学元数据。&amp;lt;/li&amp;gt;&lt;br /&gt;
    &amp;lt;/ul&amp;gt;&lt;br /&gt;
&lt;br /&gt;
    &amp;lt;h2 style=&amp;quot;background: #fff1f2; color: #9f1239; padding: 10px 18px; border-radius: 0 6px 6px 0; font-size: 1.25em; margin-top: 40px; border-left: #9f1239 6px solid; font-weight: bold;&amp;quot;&amp;gt;生信与临床映射：无注释，不精准&amp;lt;/h2&amp;gt;&lt;br /&gt;
    &lt;br /&gt;
    &amp;lt;div style=&amp;quot;overflow-x: auto; margin: 30px auto; max-width: 90%;&amp;quot;&amp;gt;&lt;br /&gt;
        &amp;lt;table style=&amp;quot;width: 100%; border-collapse: collapse; border: 1.2px solid #cbd5e1; font-size: 0.85em; text-align: center;&amp;quot;&amp;gt;&lt;br /&gt;
            &amp;lt;tr style=&amp;quot;background-color: #eff6ff; color: #1e40af;&amp;quot;&amp;gt;&lt;br /&gt;
                &amp;lt;th style=&amp;quot;padding: 12px; border: 1px solid #cbd5e1; width: 22%;&amp;quot;&amp;gt;临床分析管线&amp;lt;/th&amp;gt;&lt;br /&gt;
                &amp;lt;th style=&amp;quot;padding: 12px; border: 1px solid #cbd5e1; width: 38%;&amp;quot;&amp;gt;GTF 文件的核心赋能作用&amp;lt;/th&amp;gt;&lt;br /&gt;
                &amp;lt;th style=&amp;quot;padding: 12px; border: 1px solid #cbd5e1; width: 40%;&amp;quot;&amp;gt;指导的诊断与转化意义&amp;lt;/th&amp;gt;&lt;br /&gt;
            &amp;lt;/tr&amp;gt;&lt;br /&gt;
            &amp;lt;tr&amp;gt;&lt;br /&gt;
                &amp;lt;td style=&amp;quot;padding: 10px; border: 1px solid #cbd5e1; font-weight: 600;&amp;quot;&amp;gt;&amp;lt;strong&amp;gt;转录组定量&amp;lt;/strong&amp;gt;&amp;lt;br&amp;gt;&amp;lt;span style=&amp;quot;font-size: 0.9em; color: #64748b;&amp;quot;&amp;gt;(RNA-Seq Read Counting)&amp;lt;/span&amp;gt;&amp;lt;/td&amp;gt;&lt;br /&gt;
                &amp;lt;td style=&amp;quot;padding: 10px; border: 1px solid #cbd5e1; text-align: left;&amp;quot;&amp;gt;计数软件（如 featureCounts 或 HTSeq）比对测序得到的 &amp;lt;strong&amp;gt;[[BAM格式|BAM文件]]&amp;lt;/strong&amp;gt; 与 GTF 文件。如果一条测序短片段的坐标正好落入 GTF 标记的某个外显子区间内，则该 &amp;lt;code&amp;gt;gene_id&amp;lt;/code&amp;gt; 的表达量计数 +1。&amp;lt;/td&amp;gt;&lt;br /&gt;
                &amp;lt;td style=&amp;quot;padding: 10px; border: 1px solid #cbd5e1; background-color: #f0fdf4;&amp;quot;&amp;gt;计算 &amp;lt;strong&amp;gt;[[基因表达|基因表达矩阵]]&amp;lt;/strong&amp;gt; 的绝对前提。用于发掘 &amp;lt;strong&amp;gt;[[肿瘤微环境]]&amp;lt;/strong&amp;gt; 中的免疫抑制标记，或寻找罕见病的异常表达致病基因。&amp;lt;/td&amp;gt;&lt;br /&gt;
            &amp;lt;/tr&amp;gt;&lt;br /&gt;
            &amp;lt;tr&amp;gt;&lt;br /&gt;
                &amp;lt;td style=&amp;quot;padding: 10px; border: 1px solid #cbd5e1; font-weight: 600;&amp;quot;&amp;gt;&amp;lt;strong&amp;gt;剪接点比对&amp;lt;/strong&amp;gt;&amp;lt;br&amp;gt;&amp;lt;span style=&amp;quot;font-size: 0.9em; color: #64748b;&amp;quot;&amp;gt;(Splice-aware Alignment)&amp;lt;/span&amp;gt;&amp;lt;/td&amp;gt;&lt;br /&gt;
                &amp;lt;td style=&amp;quot;padding: 10px; border: 1px solid #cbd5e1; text-align: left;&amp;quot;&amp;gt;由于成熟的 &amp;lt;strong&amp;gt;[[信使RNA|mRNA]]&amp;lt;/strong&amp;gt; 已经被剪去了 &amp;lt;strong&amp;gt;[[内含子]]&amp;lt;/strong&amp;gt;，比对软件（如 STAR 或 HISAT2）需要提前读取 GTF 文件，获知内含子的起止坐标，从而让一条测序 Read 能够“跨越”数万碱基准确比对到两个外显子上。&amp;lt;/td&amp;gt;&lt;br /&gt;
                &amp;lt;td style=&amp;quot;padding: 10px; border: 1px solid #cbd5e1; background-color: #eff6ff;&amp;quot;&amp;gt;精准发现癌细胞中异常的 &amp;lt;strong&amp;gt;[[可变剪接|可变剪接事件 (Alternative Splicing)]]&amp;lt;/strong&amp;gt;，甚至发掘全新的 &amp;lt;strong&amp;gt;[[融合基因]]&amp;lt;/strong&amp;gt;。&amp;lt;/td&amp;gt;&lt;br /&gt;
            &amp;lt;/tr&amp;gt;&lt;br /&gt;
            &amp;lt;tr&amp;gt;&lt;br /&gt;
                &amp;lt;td style=&amp;quot;padding: 10px; border: 1px solid #cbd5e1; font-weight: 600;&amp;quot;&amp;gt;&amp;lt;strong&amp;gt;临床突变注释&amp;lt;/strong&amp;gt;&amp;lt;br&amp;gt;&amp;lt;span style=&amp;quot;font-size: 0.9em; color: #64748b;&amp;quot;&amp;gt;(Variant Annotation)&amp;lt;/span&amp;gt;&amp;lt;/td&amp;gt;&lt;br /&gt;
                &amp;lt;td style=&amp;quot;padding: 10px; border: 1px solid #cbd5e1; text-align: left;&amp;quot;&amp;gt;当在 &amp;lt;strong&amp;gt;[[全外显子测序|WES]]&amp;lt;/strong&amp;gt; 中发现了一个碱基突变（储存在 &amp;lt;strong&amp;gt;[[VCF格式|VCF文件]]&amp;lt;/strong&amp;gt; 中），注释软件（如 ANNOVAR 或 SnpEff）会去查询 GTF：这个坐标落在哪个基因？属于 CDS 还是非翻译区（&amp;lt;strong&amp;gt;[[UTR区]]&amp;lt;/strong&amp;gt;）？&amp;lt;/td&amp;gt;&lt;br /&gt;
                &amp;lt;td style=&amp;quot;padding: 10px; border: 1px solid #cbd5e1; background-color: #f8fafc;&amp;quot;&amp;gt;直接决定了一份突变报告的结论。判断突变是否导致了 &amp;lt;strong&amp;gt;[[氨基酸序列]]&amp;lt;/strong&amp;gt; 的改变，从而评估其致病性（如是否为 &amp;lt;strong&amp;gt;[[致病突变|Pathogenic Variant]]&amp;lt;/strong&amp;gt;）。&amp;lt;/td&amp;gt;&lt;br /&gt;
            &amp;lt;/tr&amp;gt;&lt;br /&gt;
        &amp;lt;/table&amp;gt;&lt;br /&gt;
    &amp;lt;/div&amp;gt;&lt;br /&gt;
&lt;br /&gt;
    &amp;lt;h2 style=&amp;quot;background: #f0fdf4; color: #166534; padding: 10px 18px; border-radius: 0 6px 6px 0; font-size: 1.25em; margin-top: 40px; border-left: #166534 6px solid; font-weight: bold;&amp;quot;&amp;gt;工程学陷阱：版本隔离与数据库的暗战&amp;lt;/h2&amp;gt;&lt;br /&gt;
&lt;br /&gt;
    &amp;lt;div style=&amp;quot;background-color: #f0fdf4; border-left: 5px solid #22c55e; padding: 15px 20px; margin: 20px 0; border-radius: 4px;&amp;quot;&amp;gt;&lt;br /&gt;
        &amp;lt;h3 style=&amp;quot;margin-top: 0; color: #14532d; font-size: 1.1em;&amp;quot;&amp;gt;基因组学中最易犯的“坐标崩塌”致命错误&amp;lt;/h3&amp;gt;&lt;br /&gt;
        &lt;br /&gt;
        &amp;lt;ul style=&amp;quot;margin-bottom: 0; color: #334155; font-size: 0.95em;&amp;quot;&amp;gt;&lt;br /&gt;
            &amp;lt;li&amp;gt;&amp;lt;strong&amp;gt;基因组版本不匹配的灾难：&amp;lt;/strong&amp;gt; GTF 的物理坐标是死死绑定在特定版本的 &amp;lt;strong&amp;gt;[[人类参考基因组]]&amp;lt;/strong&amp;gt; 上的。如果你用 &amp;lt;strong&amp;gt;[[GRCh38|GRCh38 (hg38)]]&amp;lt;/strong&amp;gt; 的参考序列去运行比对算法，却错误地输入了基于 GRCh37 (hg19) 的 GTF 文件，所有的突变注释和基因定量都将发生毁灭性的“空间错位”，直接导致数百上千个假阳性致病基因的产生。&amp;lt;/li&amp;gt;&lt;br /&gt;
            &amp;lt;li style=&amp;quot;margin-top: 10px;&amp;quot;&amp;gt;&amp;lt;strong&amp;gt;Ensembl vs RefSeq 的命名壁垒：&amp;lt;/strong&amp;gt; 目前世界上有两套最主流的注释系统。&amp;lt;strong&amp;gt;[[NCBI]]&amp;lt;/strong&amp;gt; 提供的 RefSeq 体系倾向于保守，通常只包含有明确生物学证据的转录本（前缀多为 &amp;lt;code&amp;gt;NM_&amp;lt;/code&amp;gt;）；而 &amp;lt;strong&amp;gt;[[GENCODE项目|GENCODE]]&amp;lt;/strong&amp;gt;（基于 &amp;lt;strong&amp;gt;[[Ensembl数据库|Ensembl]]&amp;lt;/strong&amp;gt;）则极其详尽，包含了大量预测的非编码转录本（前缀为 &amp;lt;code&amp;gt;ENSG&amp;lt;/code&amp;gt;）。这导致两套 GTF 文件的基因命名体系完全不同，在进行多队列临床数据合并时，必须使用基因转换字典进行极其小心的 ID 映射。&amp;lt;/li&amp;gt;&lt;br /&gt;
        &amp;lt;/ul&amp;gt;&lt;br /&gt;
    &amp;lt;/div&amp;gt;&lt;br /&gt;
&lt;br /&gt;
    &amp;lt;h2 style=&amp;quot;background: #f8fafc; color: #334155; padding: 10px 18px; border-radius: 0 6px 6px 0; font-size: 1.25em; margin-top: 40px; border-left: #64748b 6px solid; font-weight: bold;&amp;quot;&amp;gt;核心相关概念&amp;lt;/h2&amp;gt;&lt;br /&gt;
    &amp;lt;ul style=&amp;quot;padding-left: 25px; color: #334155; font-size: 0.95em;&amp;quot;&amp;gt;&lt;br /&gt;
        &amp;lt;li&amp;gt;&amp;lt;strong&amp;gt;[[GFF3格式]] (General Feature Format Version 3)：&amp;lt;/strong&amp;gt; GTF 的“近亲”与竞争者。GFF3 同样拥有 9 列，但它在第 9 列属性字段的结构上更为灵活和宏大，允许通过 &amp;lt;code&amp;gt;ID&amp;lt;/code&amp;gt; 和 &amp;lt;code&amp;gt;Parent&amp;lt;/code&amp;gt; 标签建立极其复杂的任意父子从属关系树（不仅限于 基因-&amp;gt;转录本-&amp;gt;外显子）。许多非哺乳动物（如植物或细菌）的测序项目更倾向于使用 GFF3。&amp;lt;/li&amp;gt;&lt;br /&gt;
        &amp;lt;li&amp;gt;&amp;lt;strong&amp;gt;[[BED格式]] (Browser Extensible Data)：&amp;lt;/strong&amp;gt; 与厚重繁杂的 GTF 不同，BED 格式是一种极其轻量级的坐标文件。它主要由三列组成（染色体、起始点、终止点），主要用于在 &amp;lt;strong&amp;gt;[[基因组浏览器|IGV 等基因组浏览器]]&amp;lt;/strong&amp;gt; 中快速显示连续峰值区域（如 &amp;lt;strong&amp;gt;[[ChIP-Seq]]&amp;lt;/strong&amp;gt; 发现的转录因子结合位点），而非用于精细的基因外显子组装描述。&amp;lt;/li&amp;gt;&lt;br /&gt;
        &amp;lt;li&amp;gt;&amp;lt;strong&amp;gt;[[GENCODE项目]]：&amp;lt;/strong&amp;gt; 原本是 &amp;lt;strong&amp;gt;[[ENCODE计划]]&amp;lt;/strong&amp;gt; 的一个子项目，旨在极其详尽地绘制出人类和小鼠基因组中所有蛋白质编码基因、&amp;lt;strong&amp;gt;[[假基因|假基因（Pseudogenes）]]&amp;lt;/strong&amp;gt; 和长链非编码 RNA 的地图。今天，GENCODE 发布的 GTF 文件已成为全球几乎所有单细胞测序和转录组分析的公认默认标准。&amp;lt;/li&amp;gt;&lt;br /&gt;
    &amp;lt;/ul&amp;gt;&lt;br /&gt;
&lt;br /&gt;
    &amp;lt;div style=&amp;quot;font-size: 0.92em; line-height: 1.6; color: #1e293b; margin-top: 50px; border-top: 2px solid #0f172a; padding: 15px 25px; background-color: #f8fafc; border-radius: 0 0 10px 10px;&amp;quot;&amp;gt;&lt;br /&gt;
        &amp;lt;span style=&amp;quot;color: #0f172a; font-weight: bold; font-size: 1.05em; display: inline-block; margin-bottom: 15px;&amp;quot;&amp;gt;学术参考文献 [Academic Review]&amp;lt;/span&amp;gt;&lt;br /&gt;
        &lt;br /&gt;
        &amp;lt;p style=&amp;quot;margin: 12px 0; border-bottom: 1px solid #e2e8f0; padding-bottom: 10px;&amp;quot;&amp;gt;&lt;br /&gt;
            [1] &amp;lt;strong&amp;gt;Harrow J, Frankish A, Gonzalez JM, et al. (2012).&amp;lt;/strong&amp;gt; &amp;lt;em&amp;gt;GENCODE: the reference human genome annotation for The ENCODE Project.&amp;lt;/em&amp;gt; &amp;lt;strong&amp;gt;[[Genome Research]]&amp;lt;/strong&amp;gt;. 22(9):1760-1774.&amp;lt;br&amp;gt;&lt;br /&gt;
            &amp;lt;span style=&amp;quot;color: #475569;&amp;quot;&amp;gt;[顶级基石文献]：该文献标志着世界上最权威的人类基因组标准注释集——GENCODE 的正式成型。详细描述了计算预测与大量手工比对（Manual Curation）相结合的过程，确立了当今全球生信领域广泛采用的 GTF 标准与质量控制金基准。&amp;lt;/span&amp;gt;&lt;br /&gt;
        &amp;lt;/p&amp;gt;&lt;br /&gt;
&lt;br /&gt;
        &amp;lt;p style=&amp;quot;margin: 12px 0; border-bottom: 1px solid #e2e8f0; padding-bottom: 10px;&amp;quot;&amp;gt;&lt;br /&gt;
            [2] &amp;lt;strong&amp;gt;Dobin A, Davis CA, Schlesinger F, et al. (2013).&amp;lt;/strong&amp;gt; &amp;lt;em&amp;gt;STAR: ultrafast universal RNA-seq aligner.&amp;lt;/em&amp;gt; &amp;lt;strong&amp;gt;[[Bioinformatics]]&amp;lt;/strong&amp;gt;. 29(1):15-21.&amp;lt;br&amp;gt;&lt;br /&gt;
            &amp;lt;span style=&amp;quot;color: #475569;&amp;quot;&amp;gt;[工程化应用核心]：介绍了当今最主流的转录组极速比对工具 STAR。该论文详细阐述了算法如何在建立基因组索引（Index）时，通过深度依赖并解析外接的 GTF 文件坐标，从而完美解决跨越长内含子的转录本剪接比对难题。&amp;lt;/span&amp;gt;&lt;br /&gt;
        &amp;lt;/p&amp;gt;&lt;br /&gt;
&lt;br /&gt;
        &amp;lt;p style=&amp;quot;margin: 12px 0; border-bottom: 1px solid #e2e8f0; padding-bottom: 10px;&amp;quot;&amp;gt;&lt;br /&gt;
            [3] &amp;lt;strong&amp;gt;Liao Y, Smyth GK, Shi W. (2014).&amp;lt;/strong&amp;gt; &amp;lt;em&amp;gt;featureCounts: an efficient general purpose program for assigning sequence reads to genomic features.&amp;lt;/em&amp;gt; &amp;lt;strong&amp;gt;[[Bioinformatics]]&amp;lt;/strong&amp;gt;. 30(7):923-930.&amp;lt;br&amp;gt;&lt;br /&gt;
            &amp;lt;span style=&amp;quot;color: #475569;&amp;quot;&amp;gt;[定量工具里程碑]：经典软件 featureCounts 的原始发布论文。作者精确定义了如何利用测序碎片（BAM）与 GTF 文件中第三列定义的“exon”特征和第九列定义的“gene_id”进行重叠计算，构成了目前单细胞及 Bulk RNA-seq 生成表达矩阵的核心方法论。&amp;lt;/span&amp;gt;&lt;br /&gt;
        &amp;lt;/p&amp;gt;&lt;br /&gt;
    &amp;lt;/div&amp;gt;&lt;br /&gt;
&lt;br /&gt;
    &amp;lt;div style=&amp;quot;margin: 40px auto; width: 90%; border: 1px solid #e2e8f0; border-radius: 8px; overflow: hidden; font-family: 'Helvetica Neue', Arial, sans-serif; font-size: 0.9em;&amp;quot;&amp;gt;&lt;br /&gt;
        &amp;lt;div style=&amp;quot;background-color: #eff6ff; color: #1e40af; padding: 8px 15px; font-weight: bold; text-align: center; border-bottom: 1px solid #dbeafe;&amp;quot;&amp;gt;&lt;br /&gt;
            [[GTF格式]] · 知识图谱&lt;br /&gt;
        &amp;lt;/div&amp;gt;&lt;br /&gt;
        &amp;lt;table style=&amp;quot;width: 100%; border-collapse: collapse; background-color: #ffffff; text-align: center;&amp;quot;&amp;gt;&lt;br /&gt;
            &amp;lt;tr style=&amp;quot;border-bottom: 1px solid #f1f5f9;&amp;quot;&amp;gt;&lt;br /&gt;
                &amp;lt;td style=&amp;quot;width: 150px; background-color: #f8fafc; color: #334155; font-weight: 600; padding: 10px 12px; vertical-align: middle;&amp;quot;&amp;gt;文件解构核心&amp;lt;/td&amp;gt;&lt;br /&gt;
                &amp;lt;td style=&amp;quot;padding: 10px 15px; color: #334155;&amp;quot;&amp;gt;标准 9 列坐标 • 强制属性：&amp;lt;code&amp;gt;gene_id&amp;lt;/code&amp;gt; 与 &amp;lt;code&amp;gt;transcript_id&amp;lt;/code&amp;gt;&amp;lt;/td&amp;gt;&lt;br /&gt;
            &amp;lt;/tr&amp;gt;&lt;br /&gt;
            &amp;lt;tr style=&amp;quot;border-bottom: 1px solid #f1f5f9;&amp;quot;&amp;gt;&lt;br /&gt;
                &amp;lt;td style=&amp;quot;width: 150px; background-color: #f8fafc; color: #334155; font-weight: 600; padding: 10px 12px; vertical-align: middle;&amp;quot;&amp;gt;标记目标层级&amp;lt;/td&amp;gt;&lt;br /&gt;
                &amp;lt;td style=&amp;quot;padding: 10px 15px; color: #334155;&amp;quot;&amp;gt;&amp;lt;strong&amp;gt;[[外显子|Exon (外显子)]]&amp;lt;/strong&amp;gt; • &amp;lt;strong&amp;gt;[[CDS区|CDS (编码序列)]]&amp;lt;/strong&amp;gt; • &amp;lt;strong&amp;gt;[[起止密码子]]&amp;lt;/strong&amp;gt;&amp;lt;/td&amp;gt;&lt;br /&gt;
            &amp;lt;/tr&amp;gt;&lt;br /&gt;
            &amp;lt;tr&amp;gt;&lt;br /&gt;
                &amp;lt;td style=&amp;quot;width: 150px; background-color: #f8fafc; color: #334155; font-weight: 600; padding: 10px 12px; vertical-align: middle;&amp;quot;&amp;gt;下游应用阵列&amp;lt;/td&amp;gt;&lt;br /&gt;
                &amp;lt;td style=&amp;quot;padding: 10px 15px; color: #334155;&amp;quot;&amp;gt;&amp;lt;strong&amp;gt;[[RNA-Seq|RNA-Seq 定量矩阵生成]]&amp;lt;/strong&amp;gt; • &amp;lt;strong&amp;gt;[[可变剪接|可变剪接发掘]]&amp;lt;/strong&amp;gt; • &amp;lt;strong&amp;gt;[[突变注释|临床变异注释]]&amp;lt;/strong&amp;gt;&amp;lt;/td&amp;gt;&lt;br /&gt;
            &amp;lt;/tr&amp;gt;&lt;br /&gt;
        &amp;lt;/table&amp;gt;&lt;br /&gt;
    &amp;lt;/div&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;/div&amp;gt;&lt;/div&gt;</summary>
		<author><name>185.180.13.101</name></author>
	</entry>
</feed>