贝叶斯网络
Bayesian Network(贝叶斯网络),又称信念网络(Belief Network),是一种概率图模型。它利用有向无环图(DAG)来可视化地描述一组随机变量(如疾病、症状、危险因素)及其条件依赖关系。如果说神经网络是模仿人脑的直觉(黑盒),那么贝叶斯网络就是模仿医生的逻辑(白盒)。它不仅能计算患病概率,还能清晰地展示因果路径,是构建具有可解释性(Explainable AI)的临床决策支持系统的首选模型。
解剖结构:节点与连边
一个贝叶斯网络由两部分组成,完美对应了医生的知识结构:
文件:Bayesian network medical diagnosis example
1. DAG (有向无环图) - 定性部分
• 节点 (Nodes): 代表变量。例如:[吸烟]、[肺癌]、[咳嗽]。
• 有向边 (Edges): 代表因果或依赖关系。例如:[吸烟] → [肺癌] → [咳嗽]。
这部分结构通常可以由医学专家直接绘制(专家知识),也可以从数据中学习。
2. CPT (条件概率表) - 定量部分
每个节点都附带一个表,量化了它受父节点影响的程度。
例如:在 [肺癌] 节点下,CPT 会告诉我们:如果 [吸烟=True],患肺癌的概率是 X%;如果 [吸烟=False],患肺癌的概率是 Y%。
双向推理能力
贝叶斯网络最强大的地方在于它支持双向推理,这恰好对应了医疗的两个核心场景:
| 推理类型 | 方向 | 临床场景 |
|---|---|---|
| 因果推理 (Causal) | 因 → 果 (Top-down) | 风险预测。 已知病人吸烟且高龄(因),预测他未来患肺癌(果)的概率。 |
| 诊断推理 (Diagnostic) | 果 → 因 (Bottom-up) | 疾病诊断。 已知病人咯血且胸痛(果),反推最可能导致该症状的基础疾病(因)。这是 溯因推理 的数学实现。 |
PK:贝叶斯网络 vs 神经网络
在 AI 医生开发中,这是两种截然不同的技术路线。
-
神经网络 (Deep Learning):
优势: 感知能力极强(看图、看病理切片)。
劣势: 黑盒。它告诉你“是肺癌”,但无法告诉你“因为A导致了B”。需要海量数据训练。 -
贝叶斯网络 (Bayesian Network):
优势: 可解释。它能展示完整的推理链条。允许融合专家知识(可以手动设定概率,不完全依赖数据)。
劣势: 难以处理非结构化数据(如图像、文本)。
关键参考文献
[1] Pearl J. (1985). Bayesian Networks: A Model of Self-Activated Memory for Evidential Reasoning.
[起源]:Judea Pearl 首次提出贝叶斯网络,将概率论引入了当时由规则主导的 AI 领域,为处理不确定性奠定了基础。
[2] Heckerman D, et al. (1992). Toward a normative expert system: The Pathfinder project. Academic Press.
[经典案例]:介绍了 Pathfinder 系统,这是一个用于淋巴结病理诊断的贝叶斯网络,其诊断准确率超过了当时大多数人类专家,是 Med-AI 的里程碑。