生物信息学

来自医学百科
77921020讨论 | 贡献2025年12月23日 (二) 15:33的版本 (建立内容为“{{Infobox | bodystyle = width: 300px; float: right; clear: right; margin: 0 0 1em 1em; border: 1px solid #a2a9b1; background: #f9f9f9; | abovestyle = backgro…”的新页面)
(差异) ←上一版本 | 最后版本 (差异) | 下一版本→ (差异)
生物信息学
英文名:Bioinformatics
学科类型 交叉学科
涉及领域 生物学计算机科学
统计学数学信息工程
核心对象 DNARNA蛋白质
主要应用 基因组学药物设计
个性化医疗系统生物学
常用工具 BLAST、Bioconductor、
AlphaFold、GATK
早期先驱 玛格丽特·戴霍夫 (Margaret Dayhoff)

生物信息学英文名:Bioinformatics)是一门利用计算机科学统计学数学的方法来分析和解释生物学数据(特别是分子生物学数据)的交叉学科

随着高通量测序(NGS)技术的发展,生物数据呈爆炸式增长。生物信息学已成为现代生物学和医学研究中不可或缺的一部分,尤其在精准医疗、新药研发和合成生物学领域发挥着关键作用。

定义与范畴

生物信息学的核心目标是通过计算手段揭示生物学奥秘。它主要包括以下三个层面的研究:

  1. 数据管理:开发数据库和算法以存储、检索和组织海量的生物数据(如GenBankUniProt)。
  2. 数据分析:利用统计学和机器学习方法挖掘数据中的生物学意义(如差异表达分析、变异检测)。
  3. 工具开发:编写软件和管道(Pipeline)以自动化处理复杂的生物学问题。

主要研究领域

序列分析

这是生物信息学最基础的内容。通过序列比对(Sequence Alignment)算法(如BLAST),研究人员可以比较不同物种的DNARNA蛋白质序列,从而推断进化关系或预测基因功能。

结构生物信息学

致力于预测蛋白质和核酸的三维结构。近年来,基于深度学习的工具(如DeepMind开发的AlphaFold)在该领域取得了革命性突破,能够高精度地从氨基酸序列预测蛋白质结构。

基因组学与转录组学

  • 基因组学:组装和注释基因组,寻找疾病相关的单核苷酸多态性(SNP)和结构变异(SV)。
  • 转录组学:分析RNA测序(RNA-Seq)数据,研究基因在不同状态下的表达水平。

网络与系统生物学

不仅仅关注单个基因,而是研究基因、蛋白质和代谢物之间的相互作用网络(Interactions Network),试图从整体层面理解生物系统的行为。

在医学中的应用

临床生物信息学

在临床诊断中,生物信息学流程被用于分析患者的遗传数据,以辅助诊断罕见遗传病或指导癌症治疗(例如检测EGFRKRAS突变以选择靶向药物)。

药物发现

  • 计算机辅助药物设计(CADD):利用分子对接(Molecular Docking)模拟药物分子与靶点蛋白的结合。
  • AI制药:利用大型语言模型(LLM)和生成式AI模型生成全新的药物分子结构。

常用数据库与工具

  • 数据库
    • NCBI(美国国家生物技术信息中心)
    • EBI(欧洲生物信息学研究所)
    • PDB(蛋白质数据库)
    • TCGA(癌症基因组图谱)
  • 编程语言Python (Biopython), R语言 (Bioconductor), Linux Shell。

参见

参考资料