贝叶斯网络

来自医学百科

Bayesian Network贝叶斯网络),又称信念网络(Belief Network),是一种概率图模型。它利用有向无环图(DAG)来可视化地描述一组随机变量(如疾病、症状、危险因素)及其条件依赖关系。如果说神经网络是模仿人脑的直觉(黑盒),那么贝叶斯网络就是模仿医生的逻辑(白盒)。它不仅能计算患病概率,还能清晰地展示因果路径,是构建具有可解释性(Explainable AI)的临床决策支持系统的首选模型。

Bayesian Network
(点击展开)
可解释的因果推理模型
奠基人 Judea Pearl (图灵奖得主)
核心结构 DAG (图) + CPT (概率表)
推理方向 预测 (因→果), 诊断 (果→因)
数据要求 可融合专家知识 (小数据友好)
核心标签 因果推断, 白盒模型

解剖结构:节点与连边

一个贝叶斯网络由两部分组成,完美对应了医生的知识结构:

   文件:Bayesian network medical diagnosis example

1. DAG (有向无环图) - 定性部分

节点 (Nodes): 代表变量。例如:[吸烟]、[肺癌]、[咳嗽]。
有向边 (Edges): 代表因果或依赖关系。例如:[吸烟] → [肺癌] → [咳嗽]。
这部分结构通常可以由医学专家直接绘制(专家知识),也可以从数据中学习。

2. CPT (条件概率表) - 定量部分

每个节点都附带一个表,量化了它受父节点影响的程度。
例如:在 [肺癌] 节点下,CPT 会告诉我们:如果 [吸烟=True],患肺癌的概率是 X%;如果 [吸烟=False],患肺癌的概率是 Y%。

双向推理能力

贝叶斯网络最强大的地方在于它支持双向推理,这恰好对应了医疗的两个核心场景:

推理类型 方向 临床场景
因果推理 (Causal) 因 → 果 (Top-down) 风险预测。
已知病人吸烟且高龄(因),预测他未来患肺癌(果)的概率。
诊断推理 (Diagnostic) 果 → 因 (Bottom-up) 疾病诊断。
已知病人咯血且胸痛(果),反推最可能导致该症状的基础疾病(因)。这是 溯因推理 的数学实现。

PK:贝叶斯网络 vs 神经网络

在 AI 医生开发中,这是两种截然不同的技术路线。

  • 神经网络 (Deep Learning):
    优势: 感知能力极强(看图、看病理切片)。
    劣势: 黑盒。它告诉你“是肺癌”,但无法告诉你“因为A导致了B”。需要海量数据训练。
  • 贝叶斯网络 (Bayesian Network):
    优势: 可解释。它能展示完整的推理链条。允许融合专家知识(可以手动设定概率,不完全依赖数据)。
    劣势: 难以处理非结构化数据(如图像、文本)。
       关键参考文献
       

[1] Pearl J. (1985). Bayesian Networks: A Model of Self-Activated Memory for Evidential Reasoning.
[起源]:Judea Pearl 首次提出贝叶斯网络,将概率论引入了当时由规则主导的 AI 领域,为处理不确定性奠定了基础。

[2] Heckerman D, et al. (1992). Toward a normative expert system: The Pathfinder project. Academic Press.
[经典案例]:介绍了 Pathfinder 系统,这是一个用于淋巴结病理诊断的贝叶斯网络,其诊断准确率超过了当时大多数人类专家,是 Med-AI 的里程碑。

           贝叶斯网络 · 知识图谱
上级概念 概率图模型 (PGM) • 机器学习
关键特性 条件独立性 (Markov Blanket) • 因果图
应用工具 NeticaGeNIepgmpy (Python库)
进阶变体 动态贝叶斯网络 (DBN, 处理时间序列) • 马尔可夫网络