MHCflurry
来自医学百科
|
MHCflurry 架构:基于集成深度学习的抗原呈递预测模型
| |
| 开发团队 | 纽约西奈山伊坎医学院 (Icahn School of Medicine at Mount Sinai) |
|---|---|
| 最新版本 | MHCflurry 2.0 |
| 算法核心 | 卷积神经网络 (CNN) 集成模型 |
| 核心参数 | $IC_{50}$ 结合力, 呈递评分 (PS) |
| 许可协议 | Apache License 2.0 (开源) |
MHCflurry 是一款基于深度学习(Deep Learning)的开源算法框架,专门用于预测肽段与主要组织相容性复合体 I 类(MHC-I)分子的结合亲和力。作为 **新抗原预测** 领域的重要工具,MHCflurry 不仅能计算物理结合强度,还通过其 2.0 版本引入了专门的“呈递模型”(Presentation Model),该模型整合了抗原加工动力学(如蛋白酶体切割及 TAP 转运),显著提升了对细胞表面真实展示抗原的预测精度。
在 2025 年的精准免疫诊疗中,MHCflurry 因其开源透明性、高性能的本地化部署能力以及对罕见 HLA分型 的良好支持,成为开发个性化肿瘤疫苗和筛选 **TCR-T治疗** 靶点的核心组件。
核心技术逻辑与 2.0 特性[编辑 | 编辑源代码]
MHCflurry 的性能优势来源于其独特的模型设计:
- **集成学习 (Ensemble Learning)**:通过训练多个不同结构的卷积神经网络(CNN)并取其加权平均值,有效降低了单模型的预测偏置。
- **双模型架构**:
- **Affinity Model**:纯粹预测肽段与 MHC 结合槽的亲和力(以 $IC_{50}$ 表示)。
- **Presentation Model**:通过对大规模质谱(MS)洗脱数据建模,学习细胞内抗原加工的非序列依赖性特征。
- **泛等位基因支持**:利用 HLA 伪序列(Pseudo-sequences)技术,支持对超过 14,000 种 HLA 分子的亲和力外推预测。
全外显子组 (WES) 提取突变肽段 → MHCflurry 2.0 呈递概率评分 → 鉴定具有免疫原性的真新抗原
技术评估与对比 (2025 修订版)[编辑 | 编辑源代码]
| 评估维度 | **MHCflurry 2.0** | **NetMHCpan 4.1** |
|---|---|---|
| **可访问性** | **完全开源**,支持本地大规模训练。 | 闭源。学术免费,商业需授权。 |
| **模型架构** | CNN 集成模型。 | 简单前馈神经网络 (FFN)。 |
| **呈递预测性能** | **卓越**。通过 PS 评分有效过滤假阳性。 | 优秀。通过 EL 评分评估展示概率。 |
| **资源消耗** | 较高(需 GPU 加速集成推理)。 | 较低。 |
参考文献[编辑 | 编辑源代码]
- [1] O'Donnell TJ, et al. MHCflurry: Open-Source Class I MHC Binding Affinity Prediction. Cell Systems. 2018;7(1):129-132. (MHCflurry 初始版本奠基文献)
- [2] O'Donnell TJ, et al. MHCflurry 2.0: Predicting MHC Class I Antigen Presentation by Integrating Binding Affinity and Eluted Peptide Data. Cell Systems. 2020;11(1):42-48. (2.0 版本呈递模型发布)
- [3] Bulik-Sullivan B, et al. Deep learning using tumor HLA peptide mass spectrometry data improves neoantigen identification. Nature Biotechnology. 2018.
- [4] Vita R, et al. The Immune Epitope Database (IEDB): 2024 update. Nucleic Acids Research. 2024.
- [5] NCCN Guidelines Version 1.2025: Biomarker Profiling in Advanced Cancers - Antigen Discovery Tools.