EBI
European Bioinformatics Institute(EMBL-EBI,欧洲生物信息学研究所)是欧洲生命科学数据的核心枢纽,隶属于政府间国际组织 EMBL (欧洲分子生物学实验室)。EBI 坐落于英国剑桥南部的 Wellcome Genome Campus,致力于收集、存储、管理和共享全球生物数据。作为 INSDC (国际核苷酸序列数据库合作组织) 的重要成员,EBI 与美国的 NCBI 和日本的 DDBJ 共同构成了全球生物数据的“三大支柱”。它维护着包括 Ensembl (基因组)、UniProt (蛋白质) 和 AlphaFold Database (蛋白结构预测) 在内的数十个世界级数据库,是全球科研人员不可或缺的基础设施。
全球数据协作:INSDC
生物信息学领域有一个不成文的规定:数据无国界。EBI 通过 INSDC (International Nucleotide Sequence Database Collaboration) 协议,每天与另外两家机构进行数据同步交换。这意味着你在 EBI 提交的数据,第二天就会出现在 NCBI。
EBI 核心资源矩阵
EBI 维护着数百个数据库,涵盖了从 DNA 到蛋白质、从小分子药物到系统生物学的全谱系:
| 领域 | 数据库名称 | 功能描述 |
|---|---|---|
| 基因组 | Ensembl | 提供高质量的脊椎动物基因组注释和浏览器。 |
| 蛋白质 | UniProt | 全球最权威的蛋白质序列和功能信息资源(与 SIB, PIR 合办)。 |
| 结构 | PDBe | Protein Data Bank 的欧洲节点,专注于大分子 3D 结构数据。 |
| 化学/药物 | ChEMBL | 不仅是化学数据库,更是连接“化学”与“生物学”的生物活性数据库。 |
| AI 预测 | AlphaFold DB | 与 DeepMind 合作,提供几乎所有已知蛋白质的预测结构。 |
培训与产业合作
除了提供数据,EBI 还是全球生物信息学人才的“黄埔军校”。其 Training Programme 提供大量免费的在线课程和线下工作坊。同时,通过 Industry Programme,EBI 与辉瑞、阿斯利康等制药巨头保持紧密合作,推动竞争前 (Pre-competitive) 的数据标准制定。
学术参考文献 [Academic Review]
[1] Cook CE, et al. (2020). The European Bioinformatics Institute in 2020: building a new foundation for open scientific discovery. Nucleic Acids Research.
[点评]:EBI 官方发布的年度概况,详细介绍了其数据资源的增长、基础设施更新以及开放科学战略。
[2] The UniProt Consortium. (2023). UniProt: the universal protein knowledgebase in 2023. Nucleic Acids Research.
[点评]:介绍了 UniProt 数据库的最新进展,特别是结合 AI 预测结构数据的整合。
[3] Varadi M, et al. (2022). AlphaFold Protein Structure Database: massively expanding the structural coverage of protein-sequence space. Nucleic Acids Research.
[点评]:介绍了由 EBI 托管的 AlphaFold 数据库,这是结构生物学领域的里程碑事件。