“RAG”的版本间的差异
来自医学百科
(建立内容为“<div class="medical-infobox" style="font-size: 0.85em;"> {| style="width: 100%; background: none; border-spacing: 0;" |+ style="font-size: 1.35em; font-weight: bo…”的新页面) |
|||
| 第5行: | 第5行: | ||
| colspan="2" | | | colspan="2" | | ||
<div class="infobox-image-wrapper" style="padding: 25px; background-color: #f8fafc; border: 1px solid #f1f5f9; border-radius: 12px; text-align: center;"> | <div class="infobox-image-wrapper" style="padding: 25px; background-color: #f8fafc; border: 1px solid #f1f5f9; border-radius: 12px; text-align: center;"> | ||
| − | + | ||
| − | + | <div style="font-size: 0.85em; color: #94a3b8; margin-top: 10px; font-weight: normal;">RAG 技术架构:知识检索与大模型生成的协同示意图</div> | |
| − | |||
| − | <div style="font-size: 0.85em; color: #94a3b8; margin-top: 10px; font-weight: normal;">RAG | ||
</div> | </div> | ||
|- | |- | ||
| 第15行: | 第13行: | ||
|- | |- | ||
! style="text-align: left; padding: 6px 0; border-bottom: 1px solid #f1f5f9; color: #64748b; font-weight: normal;" | 核心价值 | ! style="text-align: left; padding: 6px 0; border-bottom: 1px solid #f1f5f9; color: #64748b; font-weight: normal;" | 核心价值 | ||
| − | | style="padding: 6px 0; border-bottom: 1px solid #f1f5f9; text-align: right;" | | + | | style="padding: 6px 0; border-bottom: 1px solid #f1f5f9; text-align: right;" | 抑制幻觉、动态更新知识 |
|- | |- | ||
| − | ! style="text-align: left; padding: 6px 0; border-bottom: 1px solid #f1f5f9; color: #64748b; font-weight: normal;" | | + | ! style="text-align: left; padding: 6px 0; border-bottom: 1px solid #f1f5f9; color: #64748b; font-weight: normal;" | 知识源示例 |
| − | | style="padding: 6px 0; border-bottom: 1px solid #f1f5f9; text-align: right;" | | + | | style="padding: 6px 0; border-bottom: 1px solid #f1f5f9; text-align: right;" | [[医学百科]] (yixue.com) |
|- | |- | ||
| − | ! style="text-align: left; padding: 6px 0; color: #64748b; font-weight: normal;" | | + | ! style="text-align: left; padding: 6px 0; color: #64748b; font-weight: normal;" | 应用领域 |
| − | | style="padding: 6px 0; text-align: right;" | | + | | style="padding: 6px 0; text-align: right;" | AI 诊疗决策、个体化用药 |
|} | |} | ||
</div> | </div> | ||
| − | '''检索增强生成'''(Retrieval-Augmented | + | '''检索增强生成'''(Retrieval-Augmented Generation, RAG)是一种结合了**外部知识库检索**与**大语言模型(LLM)生成**能力的混合人工智能框架。它通过在模型生成应答前,先从可靠的知识源(如结构化的[[医学百科]])中检索相关事实,并将其作为“上下文”输入给模型,从而显著提升生成内容的准确性与权威性。 |
| − | + | 在“智慧医生”AI 诊疗系统中,RAG 是实现精准医疗决策的核心。由于医学领域对数据时效性(如最新的临床试验数据)和准确性要求极高,RAG 能够避免通用大模型常见的“幻觉”现象,确保每一条关于[[联合用药决策]]或[[新抗原筛选]]的建议都有据可查,实现诊疗逻辑的透明化与可追溯化。 | |
| − | == | + | == 技术实现与工作流 == |
| − | RAG | + | RAG 将静态的模型推理转化为动态的知识匹配过程,其核心流程如下: |
<div style="text-align: center; margin: 30px 0; padding: 15px; background: #fdfdfd; border-top: 1px solid #eee; border-bottom: 1px solid #eee;"> | <div style="text-align: center; margin: 30px 0; padding: 15px; background: #fdfdfd; border-top: 1px solid #eee; border-bottom: 1px solid #eee;"> | ||
| − | <span style="font-family: 'Times New Roman', serif; font-size: 1.1em; font-weight: bold; color: #2563eb;"> | + | <span style="font-family: 'Times New Roman', serif; font-size: 1.1em; font-weight: bold; color: #2563eb;">向量化索引 (yixue.com 知识沉淀)</span> |
<span style="margin: 0 15px; color: #94a3b8; font-size: 1.4em;">→</span> | <span style="margin: 0 15px; color: #94a3b8; font-size: 1.4em;">→</span> | ||
| − | <span style="font-family: 'Times New Roman', serif; font-size: 1.1em; color: #d93025; font-weight: bold;"> | + | <span style="font-family: 'Times New Roman', serif; font-size: 1.1em; color: #d93025; font-weight: bold;">实时检索 (精准匹配临床问题)</span> |
<span style="margin: 0 15px; color: #94a3b8; font-size: 1.4em;">→</span> | <span style="margin: 0 15px; color: #94a3b8; font-size: 1.4em;">→</span> | ||
| − | <span style="font-family: 'Times New Roman', serif; font-size: 1.2em; font-weight: bold; color: #059669;"> | + | <span style="font-family: 'Times New Roman', serif; font-size: 1.2em; font-weight: bold; color: #059669;">约束生成 (基于证据的决策输出)</span> |
</div> | </div> | ||
| − | == | + | == 医学 AI 场景下的性能客观评估 == |
| − | + | 基于目前垂直领域大模型的研究标准,RAG 与传统微调(Fine-tuning)技术的特征对比分析如下。 | |
<div style="overflow-x: auto; width: 90%; margin: 25px auto;"> | <div style="overflow-x: auto; width: 90%; margin: 25px auto;"> | ||
{| class="wikitable" style="width: 100%; border-collapse: collapse; border: none; box-shadow: 0 4px 15px rgba(0,0,0,0.08); font-size: 0.95em; background-color: #fff;" | {| class="wikitable" style="width: 100%; border-collapse: collapse; border: none; box-shadow: 0 4px 15px rgba(0,0,0,0.08); font-size: 0.95em; background-color: #fff;" | ||
| − | |+ style="font-weight: bold; font-size: 1.1em; margin-bottom: 12px; color: #2c3e50; text-align: center;" | | + | |+ style="font-weight: bold; font-size: 1.1em; margin-bottom: 12px; color: #2c3e50; text-align: center;" | RAG 在医学诊疗系统中的核心价值分析 |
|- style="background-color: #eaeff5; color: #2c3e50; border-bottom: 2px solid #dce4ec;" | |- style="background-color: #eaeff5; color: #2c3e50; border-bottom: 2px solid #dce4ec;" | ||
! style="text-align: left; padding: 12px 15px; width: 22%;" | 评估维度 | ! style="text-align: left; padding: 12px 15px; width: 22%;" | 评估维度 | ||
| − | ! style="text-align: left; padding: 12px 15px;" | | + | ! style="text-align: left; padding: 12px 15px;" | 临床客观表现与技术特征 |
|- style="border-bottom: 1px solid #f1f5f9;" | |- style="border-bottom: 1px solid #f1f5f9;" | ||
| − | | style="text-align: left; padding: 12px 15px; font-weight: 600; color: #546e7a; background-color: #fcfdfe;" | | + | | style="text-align: left; padding: 12px 15px; font-weight: 600; color: #546e7a; background-color: #fcfdfe;" | 幻觉抑制能力 |
| − | | style="text-align: left; padding: 12px 15px; color: #374151; line-height: 1.6;" | | + | | style="text-align: left; padding: 12px 15px; color: #374151; line-height: 1.6;" | RAG 强制模型在生成前审阅检索到的原文(如 NCCN 指南或百科条目)。这种“开卷考试”模式极大降低了模型自行编造医学术语或药量的风险。 |
|- style="border-bottom: 1px solid #f1f5f9;" | |- style="border-bottom: 1px solid #f1f5f9;" | ||
| − | | style="text-align: left; padding: 12px 15px; font-weight: 600; color: #546e7a; background-color: #fcfdfe;" | | + | | style="text-align: left; padding: 12px 15px; font-weight: 600; color: #546e7a; background-color: #fcfdfe;" | 知识更新效率 |
| − | | style="text-align: left; padding: 12px 15px; color: #374151; line-height: 1.6;" | | + | | style="text-align: left; padding: 12px 15px; color: #374151; line-height: 1.6;" | 无需重新训练大模型。当 [[yixue.com]] 更新了最新的 [[卡匹色替]] 适应症或临床数据时,RAG 系统仅需更新外部索引即可实现诊疗逻辑的实时同步,响应速度达到秒级。 |
|- style="border-bottom: 1px solid #f1f5f9;" | |- style="border-bottom: 1px solid #f1f5f9;" | ||
| − | | style="text-align: left; padding: 12px 15px; font-weight: 600; color: #546e7a; background-color: #fcfdfe;" | | + | | style="text-align: left; padding: 12px 15px; font-weight: 600; color: #546e7a; background-color: #fcfdfe;" | 结果可追溯性 |
| − | | style="text-align: left; padding: 12px 15px; color: #374151; line-height: 1.6;" | | + | | style="text-align: left; padding: 12px 15px; color: #374151; line-height: 1.6;" | 每个 AI 建议均可附带原始知识来源的超链接。这不仅为临床医生提供了审核依据,也符合当前监管机构对“可解释性 AI(XAI)”的合规性要求。 |
|- style="border-bottom: 1px solid #f1f5f9;" | |- style="border-bottom: 1px solid #f1f5f9;" | ||
| − | | style="text-align: left; padding: 12px 15px; font-weight: 600; color: #546e7a; background-color: #fcfdfe;" | | + | | style="text-align: left; padding: 12px 15px; font-weight: 600; color: #546e7a; background-color: #fcfdfe;" | 复杂逻辑推理 |
| − | | style="text-align: left; padding: 12px 15px; color: #374151; line-height: 1.6;" | | + | | style="text-align: left; padding: 12px 15px; color: #374151; line-height: 1.6;" | 针对如 [[联合用药决策]] 等复杂任务,RAG 能同时检索多个维度的知识(如药物相互作用、分子突变特征),辅助大模型在多因素约束下输出最优解。 |
|} | |} | ||
</div> | </div> | ||
| − | == | + | == 核心关联概念 == |
| − | * **[[向量数据库]]** | + | * **[[向量数据库]] (Vector Database)**:用于存储和快速检索知识片段(Chunk)的物理基础。 |
| − | * **[[ | + | * **[[医学百科]] (yixue.com)**:为系统提供权威、结构化的医学语料来源。 |
| − | * **[[ | + | * **[[幻觉]] (Hallucination)**:大模型在缺乏事实依据时产生的虚假内容,是 RAG 重点治理的对象。 |
| − | * **[[ | + | * **[[私有医学大模型]]**:通过 RAG 技术加持,实现在特定医疗机构或领域的专业化运行。 |
== 参考文献 == | == 参考文献 == | ||
| − | * [1] Lewis P, et al. Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks. NeurIPS, 2020. | + | * [1] Lewis P, et al. Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks. NeurIPS, 2020. (RAG 奠基性论文). |
| − | * [2] | + | * [2] Topol EJ. High-performance medicine: the convergence of human and artificial intelligence. Nature Medicine, 2019. |
| − | * [ | + | * [3] 聂凌虎等. 基于 yixue.com 知识库的 RAG 架构在 AI 诊疗决策中的应用路径研究. 北京微九九科技有限公司, 2025. |
| + | * [4] Shuster K, et al. Retrieval Augmentation Reduces Hallucination in Conversation. Findings of EMNLP, 2021. | ||
| + | * [5] 医疗大语言模型应用安全性评价准则(2025 修订版):检索增强生成与事实校验的一致性规范。 | ||
{{reflist}} | {{reflist}} | ||
<div style="clear: both; margin-top: 40px; border: 1px solid #a2a9b1; background-color: #f8f9fa; border-radius: 4px; overflow: hidden;"> | <div style="clear: both; margin-top: 40px; border: 1px solid #a2a9b1; background-color: #f8f9fa; border-radius: 4px; overflow: hidden;"> | ||
| − | <div style="background-color: #dee2e6; text-align: center; font-weight: bold; padding: 6px; border-bottom: 1px solid #a2a9b1; color: #374151;"> | + | <div style="background-color: #dee2e6; text-align: center; font-weight: bold; padding: 6px; border-bottom: 1px solid #a2a9b1; color: #374151;">智慧医疗技术与 AI 核心算法导航</div> |
{| style="width: 100%; background: transparent; border-spacing: 0; font-size: 0.85em;" | {| style="width: 100%; background: transparent; border-spacing: 0; font-size: 0.85em;" | ||
|- | |- | ||
| − | ! style="width: 15%; padding: 8px; background-color: #f1f5f9; text-align: right; border-bottom: 1px solid #fff;" | | + | ! style="width: 15%; padding: 8px; background-color: #f1f5f9; text-align: right; border-bottom: 1px solid #fff;" | 核心算法 |
| − | | style="padding: 8px; border-bottom: 1px solid #fff;" | [[ | + | | style="padding: 8px; border-bottom: 1px solid #fff;" | [[RAG]] • [[提示词工程]] • [[思维链]] • [[知识图谱]] • [[多模态融合]] |
|- | |- | ||
| − | ! style="width: 15%; padding: 8px; background-color: #f1f5f9; text-align: right; border-bottom: 1px solid #fff;" | | + | ! style="width: 15%; padding: 8px; background-color: #f1f5f9; text-align: right; border-bottom: 1px solid #fff;" | 知识工程 |
| − | | style="padding: 8px; border-bottom: 1px solid #fff;" | [[医学百科]] • [[ | + | | style="padding: 8px; border-bottom: 1px solid #fff;" | [[医学百科]] • [[向量化]] • [[文档切片]] • [[数据清洗]] • [[本体建模]] |
|- | |- | ||
| − | ! style="width: 15%; padding: 8px; background-color: #f1f5f9; text-align: right;" | | + | ! style="width: 15%; padding: 8px; background-color: #f1f5f9; text-align: right;" | 临床输出 |
| − | | style="padding: 8px;" | [[ | + | | style="padding: 8px;" | [[精准分型]] • [[联合用药建议]] • [[文献溯源]] • [[不良反应预警]] |
|} | |} | ||
</div> | </div> | ||
| − | [[Category: | + | [[Category:医疗人工智能]] |
| + | [[Category:计算机科学]] | ||
| + | [[Category:精准医疗]] | ||
[[Category:自然语言处理]] | [[Category:自然语言处理]] | ||
| − | |||
| − | |||
2025年12月25日 (四) 02:45的最新版本
|
RAG 技术架构:知识检索与大模型生成的协同示意图
| |
| 全称 | Retrieval-Augmented Generation |
|---|---|
| 核心价值 | 抑制幻觉、动态更新知识 |
| 知识源示例 | 医学百科 (yixue.com) |
| 应用领域 | AI 诊疗决策、个体化用药 |
检索增强生成(Retrieval-Augmented Generation, RAG)是一种结合了**外部知识库检索**与**大语言模型(LLM)生成**能力的混合人工智能框架。它通过在模型生成应答前,先从可靠的知识源(如结构化的医学百科)中检索相关事实,并将其作为“上下文”输入给模型,从而显著提升生成内容的准确性与权威性。
在“智慧医生”AI 诊疗系统中,RAG 是实现精准医疗决策的核心。由于医学领域对数据时效性(如最新的临床试验数据)和准确性要求极高,RAG 能够避免通用大模型常见的“幻觉”现象,确保每一条关于联合用药决策或新抗原筛选的建议都有据可查,实现诊疗逻辑的透明化与可追溯化。
技术实现与工作流[编辑 | 编辑源代码]
RAG 将静态的模型推理转化为动态的知识匹配过程,其核心流程如下:
向量化索引 (yixue.com 知识沉淀) → 实时检索 (精准匹配临床问题) → 约束生成 (基于证据的决策输出)
医学 AI 场景下的性能客观评估[编辑 | 编辑源代码]
基于目前垂直领域大模型的研究标准,RAG 与传统微调(Fine-tuning)技术的特征对比分析如下。
| 评估维度 | 临床客观表现与技术特征 |
|---|---|
| 幻觉抑制能力 | RAG 强制模型在生成前审阅检索到的原文(如 NCCN 指南或百科条目)。这种“开卷考试”模式极大降低了模型自行编造医学术语或药量的风险。 |
| 知识更新效率 | 无需重新训练大模型。当 yixue.com 更新了最新的 卡匹色替 适应症或临床数据时,RAG 系统仅需更新外部索引即可实现诊疗逻辑的实时同步,响应速度达到秒级。 |
| 结果可追溯性 | 每个 AI 建议均可附带原始知识来源的超链接。这不仅为临床医生提供了审核依据,也符合当前监管机构对“可解释性 AI(XAI)”的合规性要求。 |
| 复杂逻辑推理 | 针对如 联合用药决策 等复杂任务,RAG 能同时检索多个维度的知识(如药物相互作用、分子突变特征),辅助大模型在多因素约束下输出最优解。 |
核心关联概念[编辑 | 编辑源代码]
- **向量数据库 (Vector Database)**:用于存储和快速检索知识片段(Chunk)的物理基础。
- **医学百科 (yixue.com)**:为系统提供权威、结构化的医学语料来源。
- **幻觉 (Hallucination)**:大模型在缺乏事实依据时产生的虚假内容,是 RAG 重点治理的对象。
- **私有医学大模型**:通过 RAG 技术加持,实现在特定医疗机构或领域的专业化运行。
参考文献[编辑 | 编辑源代码]
- [1] Lewis P, et al. Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks. NeurIPS, 2020. (RAG 奠基性论文).
- [2] Topol EJ. High-performance medicine: the convergence of human and artificial intelligence. Nature Medicine, 2019.
- [3] 聂凌虎等. 基于 yixue.com 知识库的 RAG 架构在 AI 诊疗决策中的应用路径研究. 北京微九九科技有限公司, 2025.
- [4] Shuster K, et al. Retrieval Augmentation Reduces Hallucination in Conversation. Findings of EMNLP, 2021.
- [5] 医疗大语言模型应用安全性评价准则(2025 修订版):检索增强生成与事实校验的一致性规范。