检索增强生成

来自医学百科
77921020讨论 | 贡献2025年12月27日 (六) 00:36的版本 (建立内容为“<div style="padding: 0 5%; line-height: 1.6; color: #334155;"> '''检索增强生成'''(Retrieval-Augmented Generation, RAG),是现代大语言模型(LLM…”的新页面)
(差异) ←上一版本 | 最后版本 (差异) | 下一版本→ (差异)

检索增强生成(Retrieval-Augmented Generation, RAG),是现代大语言模型(LLM)架构中用于解决“幻觉”并实现知识时效性的核心技术方案。其核心逻辑是在模型生成响应之前,先从海量外部知识库中检索出相关的真实信息,并将这些信息作为背景输入给模型。在中医学语境下,RAG 类似于医者的“**博采众方**”与“**司外揣内**”:模型不再仅凭记忆(参数知识)作答,而是先“查阅历代医案(检索)”,再结合当前“患者脉证(上下文)”,最终给出“方药(生成)”。

检索增强生成
RAG Architecture
       RAG
外引经传,内化生成
核心组件 检索器生成器
技术目标 消除AI幻觉、增强时效
中医对应 博采众方循经考据
关键算法 向量检索余弦相似度
应用场景 智慧医生、知识库问答

技术原理:从“记忆模式”到“查表模式”[编辑 | 编辑源代码]

RAG 将 AI 的工作模式从“闭卷考试”转变为“开卷考试”。


  • **向量化存储 (Indexing)**:将医学百科或历代医案切分为短句,通过 **Embedding** 模型转化为高维空间的向量。这类似于将中药材按照功能(辛、凉、补、泄)归类入柜。
  • **检索 (Retrieval)**:当用户输入病情描述 $Q$ 时,系统将其转化为向量,并在向量数据库中计算与已知知识 $D$ 的相似度。常用的度量标准是**余弦相似度**:

$$ \text{similarity} = \cos(\theta) = \frac{\mathbf{A} \cdot \mathbf{B}}{\|\mathbf{A}\| \|\mathbf{B}\|} $$

  • **增强生成 (Generation)**:将检索到的最相关的 top-k 篇医案与原始问题组合成一个新的提示词(Prompt),引导 LLM 生成准确、有据可查的诊疗建议。

系统逻辑:中医诊疗与 RAG 的高度同构[编辑 | 编辑源代码]

RAG 的三步走策略与中医的典型临床决策路径呈现出完美的系统性相似。

RAG 技术架构与中医临床逻辑对照表
环节 RAG 技术逻辑 (AI Workflow) 中医临床逻辑 (TCM Logic)
**知识储备** **向量数据库**。存储PB级的结构化与非结构化医学文献。 **经方理论**。历代医家沉淀的诊疗范式(如《伤寒论》)。
**模式匹配** **语义检索**。基于患者主诉寻找相似向量。 **辨证**。根据“象”(症状)寻找对应的“脏”(病机)。
**决策生成** **大模型生成**。整合检索到的证据,输出解释。 **论治**。整合理论与经验,开具针对性方药。

在“智慧医生”中的应用价值[编辑 | 编辑源代码]

对于垂直领域的 AI 诊疗决策系统,RAG 是实现其“可信度”的关键技术支撑:

  • **消除幻觉 (Hallucination)**:医疗 AI 最忌讳凭空想象。RAG 要求模型必须基于检索到的《玉机真脏论》或其他权威文献作答,实现了生成的“**有根**”。
  • **动态更新 (Dynamic Update)**:无需重新训练昂贵的模型。当有新的临床指南或研究成果时,只需将其向量化存入库中,AI 即可瞬间获得最新“正气”。
  • **可解释性 (Interpretability)**:RAG 能够为每一个诊断结果提供“参考文献”。这对应了中医中“**方证对应**”的严密逻辑,让医患双方均能溯源决策依据。

参考文献[编辑 | 编辑源代码]

  • [1] **Lewis P, et al.** **Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks.** NeurIPS. 2020.
    • 【评析】**:RAG 技术的奠基性论文,定义了检索与生成端到端的训练框架。
  • [2] **yixue.com (医学百科)**. **中医诊疗决策系统架构白皮书**. 2025.
    • 【评析】**:探讨了如何利用 RAG 技术将古籍知识图谱转化为现代 AI 可用的逻辑流。
  • [3] **Vaswani A, et al.** **Attention is All You Need.** NIPS. 2017.
    • 【评析】**:Transformer 架构为 RAG 的“注意力机制”与上下文理解提供了计算基础。
AI 辅助诊疗与知识工程导航
核心技术 RAG向量数据库LLM知识图谱
中医同构 司外揣内博采众方辨证论治方证对应
实践挑战 检索精度上下文长度幻觉控制医学对齐