“生物信息学”的版本间的差异

来自医学百科
第1行: 第1行:
{{Infobox
+
<div style="padding: 0 4%; line-height: 1.8; color: #1e293b; font-family: 'Helvetica Neue', Helvetica, 'PingFang SC', Arial, sans-serif; background-color: #ffffff; max-width: 1200px; margin: auto;">
| bodystyle    = width: 300px; float: right; clear: right; margin: 0 0 1em 1em; border: 1px solid #a2a9b1; background: #f9f9f9;
 
| abovestyle  = background: #e0e0e0; font-size: 110%; font-weight: bold; text-align: center;
 
| headerstyle  = background: #eeeeee; font-weight: bold;
 
  
| above        = 生物信息学<br><small>Bioinformatics</small>
+
    <div style="margin-bottom: 30px; border-bottom: 1.2px solid #e2e8f0; padding-bottom: 25px;">
| image        = {{#if:{{{image|}}}|[[File:{{{image}}}|frameless|center|250px]]}}
+
        <p style="font-size: 1.1em; margin: 10px 0; color: #334155; text-align: justify;">
| caption      = {{{caption|}}}
+
            <strong>生物信息学</strong>(Bioinformatics)是一门高度交叉的学科,它结合了生物学、计算机科学、信息工程、数学和统计学,旨在开发用于存储、检索、组织和分析生物数据(特别是<strong>[[基因组]]</strong>序列和<strong>[[蛋白质]]</strong>结构)的方法和软件工具。
 +
            <br>随着<strong>[[人类基因组计划]]</strong>(HGP)的完成和<strong>[[二代测序]]</strong>(NGS)技术的爆发,生物学已从传统的“观察科学”转变为数据密集型的“信息科学”。
 +
            <br>生物信息学的核心任务是将海量的、碎片化的生物数据(如 A/T/C/G 序列)转化为有意义的生物学洞见(如致病机理、进化关系、药物靶点),是现代<strong>[[精准医学]]</strong>和新药研发的基石。
 +
        </p>
 +
    </div>
  
| label1      = 学科类型
+
    <div class="medical-infobox mw-collapsible mw-collapsed" style="width: 100%; max-width: 320px; margin: 0 auto 35px auto; border: 1.2px solid #bae6fd; border-radius: 12px; background-color: #ffffff; box-shadow: 0 8px 20px rgba(0,0,0,0.05); overflow: hidden;">
| data1        = [[交叉学科]]
+
       
 +
        <div style="padding: 15px; color: #1e40af; background: linear-gradient(135deg, #e0f2fe 0%, #bae6fd 100%); text-align: center; cursor: pointer;">
 +
            <div style="font-size: 1.2em; font-weight: bold; letter-spacing: 1.2px;">Bioinformatics</div>
 +
            <div style="font-size: 0.7em; opacity: 0.85; margin-top: 4px; white-space: nowrap;">In Silico Biology (点击展开)</div>
 +
        </div>
 +
       
 +
        <div class="mw-collapsible-content">
 +
            <div style="padding: 25px; text-align: center; background-color: #f8fafc;">
 +
               
 +
                <div style="font-size: 0.8em; color: #64748b; margin-top: 12px; font-weight: 600;">连接“代码”与“生命”的桥梁</div>
 +
            </div>
  
| label2      = 涉及领域
+
            <table style="width: 100%; border-spacing: 0; border-collapse: collapse; font-size: 0.85em;">
| data2        = [[生物学]][[计算机科学]]<br>[[统计学]][[数学]]
+
                <tr>
 +
                    <th colspan="2" style="padding: 8px 12px; background-color: #e0f2fe; color: #1e40af; text-align: left; font-size: 0.9em; border-top: 1px solid #bae6fd;">学科档案</th>
 +
                </tr>
 +
                <tr>
 +
                    <th style="text-align: left; padding: 6px 12px; background-color: #f8fafc; color: #475569; border-bottom: 1px solid #e2e8f0; width: 40%;">核心构成</th>
 +
                    <td style="padding: 6px 12px; border-bottom: 1px solid #e2e8f0; color: #0f172a;">生物 + 计算机 + 统计</td>
 +
                </tr>
 +
                <tr>
 +
                    <th style="text-align: left; padding: 6px 12px; background-color: #f8fafc; color: #475569; border-bottom: 1px solid #e2e8f0;">实验类型</th>
 +
                    <td style="padding: 6px 12px; border-bottom: 1px solid #e2e8f0; color: #1e40af;">[[干实验]] (Dry Lab)</td>
 +
                </tr>
 +
                <tr>
 +
                    <th style="text-align: left; padding: 6px 12px; background-color: #f8fafc; color: #475569; border-bottom: 1px solid #e2e8f0;">主要数据</th>
 +
                    <td style="padding: 6px 12px; border-bottom: 1px solid #e2e8f0; color: #0f172a;">DNA/RNA 序列, 蛋白结构</td>
 +
                </tr>
 +
                <tr>
 +
                    <th style="text-align: left; padding: 6px 12px; background-color: #f8fafc; color: #475569; border-bottom: 1px solid #e2e8f0;">核心数据库</th>
 +
                    <td style="padding: 6px 12px; border-bottom: 1px solid #e2e8f0; color: #0f172a;">[[NCBI]] (GenBank), [[PDB]]</td>
 +
                </tr>
 +
               
 +
                <tr>
 +
                    <th colspan="2" style="padding: 8px 12px; background-color: #e0f2fe; color: #1e40af; text-align: left; font-size: 0.9em; border-top: 1px solid #bae6fd;">常用工具栈</th>
 +
                </tr>
 +
                <tr>
 +
                    <th style="text-align: left; padding: 6px 12px; background-color: #f8fafc; color: #475569; border-bottom: 1px solid #e2e8f0;">编程语言</th>
 +
                    <td style="padding: 6px 12px; border-bottom: 1px solid #e2e8f0; color: #1e40af;">[[Python]], [[R语言|R]], Linux Shell</td>
 +
                </tr>
 +
                <tr>
 +
                    <th style="text-align: left; padding: 6px 12px; background-color: #f8fafc; color: #475569; border-bottom: 1px solid #e2e8f0;">比对算法</th>
 +
                    <td style="padding: 6px 12px; border-bottom: 1px solid #e2e8f0; color: #0f172a;">[[BLAST]], BWA, Bowtie</td>
 +
                </tr>
 +
                <tr>
 +
                    <th style="text-align: left; padding: 6px 12px; background-color: #f8fafc; color: #475569; border-bottom: 1px solid #e2e8f0;">变异分析</th>
 +
                    <td style="padding: 6px 12px; border-bottom: 1px solid #e2e8f0; color: #0f172a;">GATK, Mutect2</td>
 +
                </tr>
 +
                <tr>
 +
                    <th style="text-align: left; padding: 6px 12px; background-color: #f8fafc; color: #475569;">结构预测</th>
 +
                    <td style="padding: 6px 12px; color: #e11d48;">[[AlphaFold]]</td>
 +
                </tr>
 +
            </table>
 +
        </div>
 +
    </div>
  
| label3      = 核心对象
+
    <h2 style="background: #f1f5f9; color: #0f172a; padding: 10px 18px; border-radius: 0 6px 6px 0; font-size: 1.25em; margin-top: 40px; border-left: 6px solid #0f172a; font-weight: bold;">三大核心领域 (The Big Three)</h2>
| data3        = [[脱氧核糖核酸|DNA]]、[[核糖核酸|RNA]][[蛋白质]]
+
    <p style="margin: 15px 0; text-align: justify;">
 +
        生物信息学虽然包罗万象,但其核心工作流主要围绕着中心法则(DNA -> RNA -> Protein)展开。
 +
    </p>
 +
    <div style="overflow-x: auto; margin: 20px auto;">
 +
        <table style="width: 100%; border-collapse: collapse; border: 1.2px solid #cbd5e1; font-size: 0.9em; text-align: left;">
 +
            <tr style="background-color: #f1f5f9; border-bottom: 2px solid #0f172a;">
 +
                <th style="padding: 12px; border: 1px solid #cbd5e1; color: #0f172a; width: 20%;">组学 (Omics)</th>
 +
                <th style="padding: 12px; border: 1px solid #cbd5e1; color: #1e40af; width: 35%;">核心问题</th>
 +
                <th style="padding: 12px; border: 1px solid #cbd5e1; color: #475569; width: 45%;">典型分析任务</th>
 +
            </tr>
 +
            <tr>
 +
                <td style="padding: 10px; border: 1px solid #cbd5e1; font-weight: 600;">[[基因组学]]<br>(Genomics)</td>
 +
                <td style="padding: 10px; border: 1px solid #cbd5e1;"><strong>“我有什么?”</strong><br>研究 DNA 序列本身及其变异。</td>
 +
                <td style="padding: 10px; border: 1px solid #cbd5e1;"><strong>序列组装</strong> (Assembly)<strong>变异检测</strong> (Variant Calling, SNPs/Indels)、系统发育树构建。</td>
 +
            </tr>
 +
            <tr>
 +
                <td style="padding: 10px; border: 1px solid #cbd5e1; font-weight: 600;">[[转录组学]]<br>(Transcriptomics)</td>
 +
                <td style="padding: 10px; border: 1px solid #cbd5e1;"><strong>“我在做什么?”</strong><br>研究基因的表达水平。</td>
 +
                <td style="padding: 10px; border: 1px solid #cbd5e1;"><strong>差异表达分析</strong> (Differential Expression, DE)、单细胞测序聚类 (scRNA-seq)、通路富集 (GO/KEGG)。</td>
 +
            </tr>
 +
            <tr>
 +
                <td style="padding: 10px; border: 1px solid #cbd5e1; font-weight: 600;">[[蛋白质组学]]<br>(Proteomics)</td>
 +
                <td style="padding: 10px; border: 1px solid #cbd5e1;"><strong>“我长什么样?”</strong><br>研究蛋白的结构与功能。</td>
 +
                <td style="padding: 10px; border: 1px solid #cbd5e1;"><strong>结构预测</strong> (AlphaFold)、分子对接 (Docking)、蛋白质相互作用网络 (PPI)。</td>
 +
            </tr>
 +
        </table>
 +
    </div>
  
| label4      = 主要应用
+
    <h2 style="background: #f1f5f9; color: #0f172a; padding: 10px 18px; border-radius: 0 6px 6px 0; font-size: 1.25em; margin-top: 40px; border-left: 6px solid #0f172a; font-weight: bold;">从数据到临床:NGS 分析流程</h2>
| data4        = [[基因组学]]、[[药物设计]]、<br>[[精准医疗]]
+
    <p style="margin: 15px 0; text-align: justify;">
 +
        在临床诊断(如癌症、遗传病)中,生物信息学主要负责处理高通量测序(NGS)产生的原始数据。
 +
    </p>
 +
    <div style="background-color: #f0f9ff; border-left: 5px solid #1e40af; padding: 15px 20px; margin: 20px 0; border-radius: 4px;">
 +
        <ul style="margin: 0; padding-left: 20px; color: #334155;">
 +
            <li style="margin-bottom: 12px;"><strong>原始数据 (Raw Data):</strong> 测序仪产出的 <code>.fastq</code> 文件,包含数亿条短序列(Reads)及其质量评分。</li>
 +
            <li style="margin-bottom: 12px;"><strong>比对 (Alignment/Mapping):</strong> 将短序列像“拼图”一样比对到人类参考基因组(Reference Genome, 如 hg38)上,生成 <code>.bam</code> 文件。</li>
 +
            <li style="margin-bottom: 12px;"><strong>变异检出 (Variant Calling):</strong> 找出样本与参考基因组不同的位点,生成 <code>.vcf</code> 文件。</li>
 +
            <li style="margin-bottom: 0;"><strong>注释与解读 (Annotation):</strong> 利用数据库(如 ClinVar, gnomAD)标记这些变异的临床意义(良性/致病),最终生成临床报告。</li>
 +
        </ul>
 +
    </div>
  
| label5      = 常用工具
+
    <div style="font-size: 0.92em; line-height: 1.6; color: #1e293b; margin-top: 50px; border-top: 2px solid #0f172a; padding: 15px 25px; background-color: #f8fafc; border-radius: 0 0 10px 10px;">
| data5        = [[BLAST]]、Bioconductor、<br>[[AlphaFold]]
+
        <span style="color: #0f172a; font-weight: bold; font-size: 1.05em; display: inline-block; margin-bottom: 15px;">关键相关概念 [Key Concepts]</span>
 +
       
 +
        <p style="margin: 12px 0; border-bottom: 1px solid #e2e8f0; padding-bottom: 10px;">
 +
            <strong>1. Pipeline (分析流程):</strong> 生信分析通常不是单一软件完成的,而是将多个工具串联起来(如 QC -> Trim -> Map -> Call),形成自动化的工作流(Workflow),常用工具如 Nextflow, Snakemake。
 +
        </p>
  
| label6      = 早期先驱
+
        <p style="margin: 12px 0; border-bottom: 1px solid #e2e8f0; padding-bottom: 10px;">
| data6        = 玛格丽特·戴霍夫
+
            <strong>2. Algorithm (算法):</strong> 生物信息学的核心。例如 <strong>动态规划</strong>(Dynamic Programming)用于序列比对,<strong>隐马尔可夫模型</strong>(HMM)用于基因预测,<strong>深度学习</strong>(Deep Learning)用于蛋白结构预测。
}}
+
        </p>
  
'''生物信息学'''(Bioinformatics)是一门利用[[计算机科学]]、[[统计学]]和[[数学]]的方法来分析和解释生物学数据(特别是分子生物学数据)的[[交叉学科]]。它致力于开发算法和软件工具,以从大规模复杂的生物数据中提取知识。
+
        <p style="margin: 12px 0;">
 +
            <strong>3. Databases (数据库):</strong> 生信的“粮仓”。包括一级数据库(存储原始数据,如 GenBank, SRA)和二级数据库(存储整理后的知识,如 UniProt, KEGG, OMIM)。
 +
        </p>
 +
    </div>
  
该学科是现代生物学和医学研究的核心支柱,特别是在[[人类基因组计划]]完成后,海量数据的解读需求使得生物信息学成为[[精准医疗]]和新药研发的关键驱动力。<ref name="Mount2004">Mount, David W. (2004). ''Bioinformatics: Sequence and Genome Analysis'' (2nd ed.). Cold Spring Harbor Laboratory Press. ISBN 978-0-87969-712-9.</ref>
+
    <div style="font-size: 0.92em; line-height: 1.6; color: #1e293b; margin-top: 20px; border-top: 2px solid #0f172a; padding: 15px 25px; background-color: #ffffff;">
 +
        <span style="color: #0f172a; font-weight: bold; font-size: 1.05em; display: inline-block; margin-bottom: 15px;">学术参考文献 [Academic Review]</span>
 +
       
 +
        <p style="margin: 12px 0; border-bottom: 1px solid #e2e8f0; padding-bottom: 10px;">
 +
            [1] <strong>Altschul SF, et al. (1990).</strong> <em>Basic local alignment search tool (BLAST).</em> <strong>[[J Mol Biol]]</strong>. <br>
 +
            <span style="color: #475569;">[点评]:史上引用率最高的生物学论文之一。BLAST 算法让海量序列的快速比对成为可能,是生物信息学的基石工具。</span>
 +
        </p>
  
== 定义与范畴 ==
+
        <p style="margin: 12px 0; border-bottom: 1px solid #e2e8f0; padding-bottom: 10px;">
生物信息学的研究范畴主要包括三个层面:
+
            [2] <strong>Lander ES, et al. (2001).</strong> <em>Initial sequencing and analysis of the human genome.</em> <strong>[[Nature]]</strong>. <br>
# '''数据管理''':建立数据库以存储、检索和组织海量的生物数据(如[[GenBank]]、[[UniProt]])。
+
            <span style="color: #475569;">[点评]:人类基因组计划(HGP)草图发表。标志着生物学正式进入组学(Omics)和大数据时代。</span>
# '''数据分析''':利用计算方法挖掘数据中的生物学意义(如差异表达分析、变异检测)。
+
        </p>
# '''工具开发''':编写软件和管道(Pipeline)以自动化处理生物学问题。
 
  
== 主要研究领域 ==
+
        <p style="margin: 12px 0;">
=== 序列分析 ===
+
            [3] <strong>Jumper J, et al. (2021).</strong> <em>Highly accurate protein structure prediction with AlphaFold.</em> <strong>[[Nature]]</strong>. <br>
这是生物信息学的基础。通过序列比对(Sequence Alignment)算法(如[[BLAST]]),研究人员比较不同物种的[[DNA]]、[[RNA]]或[[蛋白质]]序列,推断进化关系或预测基因功能。2001年人类基因组草图的发布是序列分析史上的里程碑。<ref name="Lander2001">Lander, E. S., et al. (2001). Initial sequencing and analysis of the human genome. ''Nature'', 409(6822), 860–921. [https://doi.org/10.1038/35057062 doi:10.1038/35057062]</ref>
+
            <span style="color: #475569;">[点评]:人工智能的胜利。解决了困扰生物学 50 年的“蛋白折叠问题”,证明了 AI 在生物信息学中的统治级潜力。</span>
 +
        </p>
 +
    </div>
  
=== 结构生物信息学 ===
+
    <div style="margin: 40px 0; border: 1px solid #e2e8f0; border-radius: 8px; overflow: hidden; font-family: 'Helvetica Neue', Arial, sans-serif; font-size: 0.9em;">
致力于预测生物大分子的三维结构。传统的X射线晶体衍射耗时耗力,而计算方法带来了革命性突破。2021年,DeepMind发布的基于深度学习的'''[[AlphaFold]]'''能够以原子级精度从氨基酸序列预测蛋白质结构,解决了困扰生物学界50年的难题。<ref name="AlphaFold2021">Jumper, J., et al. (2021). Highly accurate protein structure prediction with AlphaFold. ''Nature'', 596(7873), 583–589. [https://doi.org/10.1038/s41586-021-03819-2 doi:10.1038/s41586-021-03819-2]</ref>
+
        <div style="background-color: #eff6ff; color: #1e40af; padding: 8px 15px; font-weight: bold; text-align: center; border-bottom: 1px solid #dbeafe;">
 +
            计算生物学 · 知识图谱
 +
        </div>
 +
        <table style="width: 100%; border-collapse: collapse; background-color: #ffffff;">
 +
            <tr style="border-bottom: 1px solid #f1f5f9;">
 +
                <td style="width: 85px; background-color: #f8fafc; color: #334155; font-weight: 600; padding: 10px 12px; text-align: right; vertical-align: middle;">上级分类</td>
 +
                <td style="padding: 10px 15px; color: #334155;">[[生物学]] • [[计算机科学]] • 交叉学科</td>
 +
            </tr>
 +
            <tr style="border-bottom: 1px solid #f1f5f9;">
 +
                <td style="width: 85px; background-color: #f8fafc; color: #334155; font-weight: 600; padding: 10px 12px; text-align: right; vertical-align: middle;">技术驱动</td>
 +
                <td style="padding: 10px 15px; color: #334155;">[[NGS]] (测序) • [[AI]] (深度学习) • 云计算</td>
 +
            </tr>
 +
            <tr>
 +
                <td style="width: 85px; background-color: #f8fafc; color: #334155; font-weight: 600; padding: 10px 12px; text-align: right; vertical-align: middle;">应用场景</td>
 +
                <td style="padding: 10px 15px; color: #334155;">[[药物研发]] • [[遗传咨询]] • 进化分析</td>
 +
            </tr>
 +
        </table>
 +
    </div>
  
=== 基因组学与转录组学 ===
+
</div>
* '''[[基因组学]]''':组装基因组,寻找疾病相关的单核苷酸多态性([[SNP]])和结构变异(SV)。
 
* '''[[转录组学]]''':利用[[RNA测序]](RNA-Seq)技术,分析基因在特定生理或病理状态下的表达水平变化。
 
 
 
== 在医学中的应用 ==
 
=== 临床生物信息学与精准医疗 ===
 
生物信息学是将基因组数据转化为临床决策的桥梁。通过分析患者的遗传背景,医生可以实现“量体裁衣”式的治疗。这在罕见遗传病诊断和药物基因组学中尤为重要。<ref name="ReviewMed">Duffy, D. J. (2016). Problems, challenges and promises: perspectives on precision medicine and bioinformatics. ''Briefings in Bioinformatics'', 17(3), 494–504. [https://doi.org/10.1093/bib/bbv060 doi:10.1093/bib/bbv060]</ref>
 
 
 
=== 肿瘤生物信息学 ===
 
在癌症研究中,生物信息学被用于识别驱动突变(Driver Mutations)和肿瘤微环境特征。例如,基于[[TCGA]](癌症基因组图谱)的大规模泛癌种分析揭示了不同器官肿瘤之间共享的分子特征,重新定义了癌症的分子分类。<ref name="CancerBioinfo">Hoadley, K. A., et al. (2018). Cell-of-Origin Patterns Dominate the Molecular Classification of 10,000 Tumors from 33 Types of Cancer. ''Cell'', 173(2), 291–304. [https://doi.org/10.1016/j.cell.2018.03.022 doi:10.1016/j.cell.2018.03.022]</ref>
 
 
 
=== 药物发现 ===
 
* '''计算机辅助药物设计'''(CADD):模拟药物分子与靶点的结合。
 
* '''AI制药''':利用[[大型语言模型]](LLM)生成全新的药物分子结构,显著缩短研发周期。
 
 
 
== 常用工具与数据库 ==
 
* '''数据库''':[[NCBI]] (GenBank, PubMed), [[EBI]], [[PDB]] (蛋白质结构), [[TCGA]] (癌症数据)。
 
* '''编程语言''':[[Python]] (Biopython), [[R语言]] (Bioconductor), [[Linux]] Shell。
 
 
 
== 参见 ==
 
* [[计算生物学]]
 
* [[医学信息学]]
 
* [[人工智能]]
 
* [[系统生物学]]
 
 
 
== 参考资料 ==
 
{{Reflist}}
 
 
 
[[Category:生物学]]
 
[[Category:计算机科学]]
 
[[Category:生物信息学]]
 

2026年2月7日 (六) 19:58的版本

生物信息学(Bioinformatics)是一门高度交叉的学科,它结合了生物学、计算机科学、信息工程、数学和统计学,旨在开发用于存储、检索、组织和分析生物数据(特别是基因组序列和蛋白质结构)的方法和软件工具。
随着人类基因组计划(HGP)的完成和二代测序(NGS)技术的爆发,生物学已从传统的“观察科学”转变为数据密集型的“信息科学”。
生物信息学的核心任务是将海量的、碎片化的生物数据(如 A/T/C/G 序列)转化为有意义的生物学洞见(如致病机理、进化关系、药物靶点),是现代精准医学和新药研发的基石。

Bioinformatics
In Silico Biology (点击展开)
连接“代码”与“生命”的桥梁
学科档案
核心构成 生物 + 计算机 + 统计
实验类型 干实验 (Dry Lab)
主要数据 DNA/RNA 序列, 蛋白结构
核心数据库 NCBI (GenBank), PDB
常用工具栈
编程语言 Python, R, Linux Shell
比对算法 BLAST, BWA, Bowtie
变异分析 GATK, Mutect2
结构预测 AlphaFold

三大核心领域 (The Big Three)

生物信息学虽然包罗万象,但其核心工作流主要围绕着中心法则(DNA -> RNA -> Protein)展开。

组学 (Omics) 核心问题 典型分析任务
基因组学
(Genomics)
“我有什么?”
研究 DNA 序列本身及其变异。
序列组装 (Assembly)、变异检测 (Variant Calling, SNPs/Indels)、系统发育树构建。
转录组学
(Transcriptomics)
“我在做什么?”
研究基因的表达水平。
差异表达分析 (Differential Expression, DE)、单细胞测序聚类 (scRNA-seq)、通路富集 (GO/KEGG)。
蛋白质组学
(Proteomics)
“我长什么样?”
研究蛋白的结构与功能。
结构预测 (AlphaFold)、分子对接 (Docking)、蛋白质相互作用网络 (PPI)。

从数据到临床:NGS 分析流程

在临床诊断(如癌症、遗传病)中,生物信息学主要负责处理高通量测序(NGS)产生的原始数据。

  • 原始数据 (Raw Data): 测序仪产出的 .fastq 文件,包含数亿条短序列(Reads)及其质量评分。
  • 比对 (Alignment/Mapping): 将短序列像“拼图”一样比对到人类参考基因组(Reference Genome, 如 hg38)上,生成 .bam 文件。
  • 变异检出 (Variant Calling): 找出样本与参考基因组不同的位点,生成 .vcf 文件。
  • 注释与解读 (Annotation): 利用数据库(如 ClinVar, gnomAD)标记这些变异的临床意义(良性/致病),最终生成临床报告。
       关键相关概念 [Key Concepts]
       

1. Pipeline (分析流程): 生信分析通常不是单一软件完成的,而是将多个工具串联起来(如 QC -> Trim -> Map -> Call),形成自动化的工作流(Workflow),常用工具如 Nextflow, Snakemake。

2. Algorithm (算法): 生物信息学的核心。例如 动态规划(Dynamic Programming)用于序列比对,隐马尔可夫模型(HMM)用于基因预测,深度学习(Deep Learning)用于蛋白结构预测。

3. Databases (数据库): 生信的“粮仓”。包括一级数据库(存储原始数据,如 GenBank, SRA)和二级数据库(存储整理后的知识,如 UniProt, KEGG, OMIM)。

       学术参考文献 [Academic Review]
       

[1] Altschul SF, et al. (1990). Basic local alignment search tool (BLAST). J Mol Biol.
[点评]:史上引用率最高的生物学论文之一。BLAST 算法让海量序列的快速比对成为可能,是生物信息学的基石工具。

[2] Lander ES, et al. (2001). Initial sequencing and analysis of the human genome. Nature.
[点评]:人类基因组计划(HGP)草图发表。标志着生物学正式进入组学(Omics)和大数据时代。

[3] Jumper J, et al. (2021). Highly accurate protein structure prediction with AlphaFold. Nature.
[点评]:人工智能的胜利。解决了困扰生物学 50 年的“蛋白折叠问题”,证明了 AI 在生物信息学中的统治级潜力。

           计算生物学 · 知识图谱
上级分类 生物学计算机科学 • 交叉学科
技术驱动 NGS (测序) • AI (深度学习) • 云计算
应用场景 药物研发遗传咨询 • 进化分析