美国国家生物技术信息中心

来自医学百科


美国国家生物技术信息中心
机构概况
上级部门 美国国家医学图书馆 (NLM) / 美国国立卫生研究院 (NIH)
总部地点 马里兰州贝塞斯达
官方网站 www.ncbi.nlm.nih.gov

美国国家生物技术信息中心英文名:National Center for Biotechnology Information,简称NCBI)是美国国家医学图书馆(NLM)的一个分支机构,而 NLM 隶属于美国国立卫生研究院(NIH)。

NCBI 成立于 1988 年,总部位于马里兰州贝塞斯达。它是全球生物信息学领域最重要的权威机构,负责建立并维护一系列对生物医学和基因组学研究至关重要的数据库,并开发分析基因组数据的软件工具。


主要职能[编辑 | 编辑源代码]

NCBI 的核心任务包括:

  1. 数据库维护:建立关于分子生物学、生物化学和遗传学的公开数据库。
  2. 软件工具开发:开发用于分析序列数据、蛋白质结构和文献检索的软件(如 BLAST)。
  3. 标准制定:制定生物医学数据的标准化格式(如 RefSeq 标准)。
  4. 教育与培训:通过培训和协作促进生物信息学知识的普及。

核心数据库资源[编辑 | 编辑源代码]

NCBI 托管了超过 40 个大型数据库,构成了全球精准医疗的数据基石:

1. 文献与百科 (Literature)[编辑 | 编辑源代码]

  • PubMed:全球最大的生物医学论文摘要数据库。
  • PMC (PubMed Central):提供全文免费获取的数字化生物医学期刊存档。
  • Bookshelf:提供生物医学类书籍和报告的在线访问。

2. 基因组与遗传变异 (Genomes & Variation)[编辑 | 编辑源代码]

  • GenBank:由 NCBI 维护的公开 DNA 序列数据库。
  • RefSeq:经过人工校验的参考序列库,是 NGS 检测的权威对齐标准。
  • ClinVar:报告人类遗传变异与其临床致病性之间关系的权威库。
  • dbSNP:单核苷酸多态性(SNP)数据库。

3. 蛋白质与化学 (Proteins & Chemicals)[编辑 | 编辑源代码]

  • Protein:收录各种来源的蛋白质序列。
  • PubChem:包含数亿个小分子化学物及其生物活性的信息,常用于新药研发。

技术架构:Entrez 与 E-Utilities[编辑 | 编辑源代码]

NCBI 开发了 **Entrez** 统一搜索系统,允许用户跨库检索。为了支持现代 AI 和大规模数据分析,NCBI 提供了 **E-Utilities API**。

  • 在医疗AI中的应用:该接口是 **检索增强生成 (RAG)** 架构获取实时、权威医学证据的关键管道。通过 API,系统可以自动提取最新的临床指南变动或新发现的致病突变证据。

参见[编辑 | 编辑源代码]

参考文献[编辑 | 编辑源代码]

  1. Sayers EW, et al. Database resources of the National Center for Biotechnology Information. Nucleic Acids Res. 2024.
  2. NCBI Resource Coordinators. Database resources of the National Center for Biotechnology Information. Nucleic Acids Res. 2018.