简介

文章系统介绍检索增强生成(RAG)技术在医疗健康领域的创新应用,包括急诊文档自动化、知识图谱增强医疗助手、迭代式智能问答系统及多模态电子健康记录分析等。这些研究有效解决了大语言模型在医疗应用中的幻觉问题、知识更新滞后和透明度不足等挑战,为构建可信赖的AI医疗决策支持系统提供了技术路径和实证基础,展现了RAG技术在提升医疗AI性能方面的巨大潜力。


颠覆性技术如大模型和人工智能正以迅猛的速度改变医疗健康领域。《论文速读》栏目旨在跟踪这些领域的最新进展,整理全球学术期刊中的前沿论文,帮助读者洞悉热门领域的最新趋势和突破。

本期深度聚焦检索增强生成(RAG)技术在医疗健康领域的创新应用与突破进展。内容涵盖从系统性综述到前沿方法创新的全景式研究,包括:融合知识图谱推理的医疗助手RAG模型、支持迭代查询的智能医疗问答系统、多模态电子健康记录的RAG驱动分析框架,以及急诊医学文档自动化和术前评估等临床实践应用。这些研究不仅展现了RAG技术在解决大型语言模型医疗应用中幻觉问题、知识更新滞后和透明度不足等关键挑战方面的巨大潜力,更为构建可信赖、高精度的AI医疗决策支持系统提供了重要的技术路径和实证基础。

期待与您共同探索大模型和医学人工智能领域的前沿科研成果。

01

In-silico evaluation of aging-related interventions using omics data and predictive modeling

****◎ 标题:****基于检索增强文本生成的大语言模型急诊医疗文档自动化流程研究

◎ 摘要:在急诊医疗环境中,准确高效的患者信息记录至关重要。传统的人工记录方法不仅耗时,而且容易出错,可能影响患者治疗效果。大语言模型(LLMs)为改进医疗通信系统提供了一个有前景的解决方案,但在临床实践中,特别是在德语等非英语环境下的应用面临着内容准确性、临床相关性和数据隐私等挑战。本研究通过开发和评估一个德语急诊医疗文档自动化流程来应对这些挑战。研究目标包括:(1)生成具有已知真实数据的合成对话,创建用于评估自然语言处理性能的受控数据集;(2)设计创新的流程以从这些对话中提取关键临床信息。研究从MIMIC-IV-ED数据集中选取了100份匿名患者记录,确保了人口统计学特征、主诉和病情的多样性。采用检索增强生成(RAG)系统,通过分块、嵌入和动态提示等技术提取关键的名义和数值特征。评估指标包括精确率、召回率、F1分数和情感分析。初步结果显示,系统在药物数据提取方面表现出高度准确性(F1分数:86.21%-100%),但在处理细微的临床语言时性能有所下降,这表明在实际急诊环境应用前还需要进一步改进。

作者**:**Moser D., Bender M., et al.

**◎ 发表日期:**2025-06-18

**◎ 发表期刊:**Applied Artificial Intelligence

原文链接:https://pubmed.ncbi.nlm.nih.gov/40755813/

Figure: Hierarchical expansion process for dialogue generation.

02

MedRAG: Enhancing Retrieval-augmented Generation with Knowledge Graph-Elicited Reasoning for Healthcare Copilot

◎ 标题:MedRAG:基于知识图谱推理增强的医疗助手检索增强生成模型

◎ 摘要:检索增强生成(RAG)技术非常适合用于检索隐私敏感的电子健康记录(EHR)。它可以作为医疗助手的关键模块,帮助减少医疗从业者和患者的误诊。然而,现有基于启发式的医疗领域RAG模型在诊断准确性和特异性方面仍然不足,特别是对于具有相似表现的疾病。本文提出了MedRAG,这是一个通过知识图谱(KG)推理增强的RAG模型,可以基于症状表现检索诊断和治疗建议。MedRAG系统地构建了一个包含各种疾病关键诊断差异的四层层次诊断知识图谱。这些差异与从EHR数据库检索的相似病例动态整合,并在大语言模型中进行推理。这个过程不仅能够提供更准确和具体的决策支持,还能主动提供后续问题以增强个性化医疗决策。MedRAG在公开数据集DDXPlus和来自陈笃生医院的私有慢性疼痛诊断数据集(CPDD)上进行了评估,并与现有的RAG方法进行了比较。实验结果表明,通过利用知识图谱的信息整合和关系推理能力,MedRAG能够提供更具体的诊断见解,并在降低误诊率方面优于现有最先进的模型。

作者**:****Zhao X., Liu S.**, et al.

**◎ 发表日期:**2025-06-17

**◎ 发表期刊:**arXiv preprint

原文链接:https://arxiv.org/abs/2502.04413

Figure: The overall framework of MedRAG.

03

Retrieval augmented generation for large language models in healthcare: A systematic review

****◎ 标题:****医疗健康领域大语言模型的检索增强生成技术:系统性综述

**◎ 摘要:**大语言模型(LLMs)在医疗等关键领域展现出解决复杂任务的巨大潜力。然而,LLMs受限于其经常过时的训练数据,容易生成不准确的(“幻觉”)内容,且生成内容缺乏透明度。为解决这些局限性,检索增强生成(RAG)技术通过引入外部知识源来确保LLMs响应的准确性。但在医疗领域,目前缺乏对可用数据集、RAG方法论和评估框架的系统性认识。本综述旨在通过评估医疗领域LLMs采用的基于RAG的方法来弥补这一差距,重点关注检索、增强和生成的不同步骤。此外,我们还识别了现有文献中的局限性、优势和差距。我们的综合分析显示,78.9%的研究使用英语数据集,21.1%使用中文数据集。我们发现医疗领域的RAG基础LLMs采用了多种技术,包括朴素RAG、高级RAG和模块化RAG。值得注意的是,GPT-3.5/4等专有模型是医疗领域RAG应用中使用最多的。我们发现基于RAG的应用缺乏标准化的评估框架。此外,大多数研究并未评估或解决医疗领域RAG相关的伦理考虑。在临床环境中实施AI系统时,考虑其固有的伦理挑战至关重要。最后,我们强调需要进一步研究和开发,以确保RAG在医疗领域的负责任和有效采用。

作者**:Amugongo L.M., Mascheroni P., et al.**

**◎ 发表日期:**2025-06-11

**◎ 发表期刊:**PLOS Digital Health

原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC12157099/

Figure: A schematic illustration of the basic RAG workflow applied to answering a user question in the medical domain.

04

Retrieval augmented generation for 10 large language models and its generalizability in assessing medical fitness

****◎ 标题:****10种大语言模型的检索增强生成及其在评估医疗适应性方面的通用性研究

**◎ 摘要:**大语言模型(LLMs)在医疗应用方面显示出巨大潜力,但往往缺乏特定领域的专业知识。检索增强生成(RAG)通过整合专业知识实现了模型的定制化。本研究使用35个本地和23个国际指南,评估了LLM-RAG模型在确定手术适应性和提供术前指导方面的准确性、一致性和安全性。研究测试了10种LLMs(包括GPT3.5、GPT4、GPT4o、Gemini、Llama2和Llama3、Claude)在14种临床场景中的表现。共生成3234个响应并与448个人工生成的答案进行比较。采用国际指南的GPT4 LLM-RAG模型能在20秒内生成答案,并达到最高的准确率,显著优于人工生成的响应(96.4%对86.6%,p=0.016)。此外,该模型没有出现幻觉现象,且输出的一致性高于人类。本研究凸显了基于GPT-4的LLM-RAG模型在提供高度准确、高效和一致的术前评估方面的潜力。

作者**:**Ke Y.H., Jin L., et al.

**◎ 发表日期:**2025-04-05

**◎ 发表期刊:**npj Digital Medicine

原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC11971376/

Figure: Percentage of Accurately Predicting Medical Fitness for Surgery Across Different Agents.

05

Improving Retrieval-Augmented Generation in Medicine with Iterative Follow-up Questions

****◎ 标题:****通过迭代式追问改进医学领域的检索增强生成

**◎ 摘要:**大语言模型(LLMs)在解决医学问题方面展现出巨大潜力。虽然它们具备相当的医学知识,但仍可能产生幻觉并且在知识更新方面缺乏灵活性。尽管检索增强生成(RAG)技术被提出用于通过外部知识库增强LLMs的医学问答能力,但在需要多轮信息查询的复杂案例中可能仍会失效。为解决这个问题,我们提出了医学迭代式RAG(i-MedRAG),使LLMs能够基于先前的信息查询尝试迭代地提出后续问题。在i-MedRAG的每次迭代中,后续问题将由传统RAG系统回答,并进一步用于指导下一轮迭代的查询生成。我们的实验表明,与传统RAG相比,i-MedRAG在美国医师执照考试(USMLE)的临床病例复杂问题以及大规模多任务语言理解(MMLU)数据集的各种知识测试中,显著提升了各类LLMs的性能。值得注意的是,我们的零样本i-MedRAG在MedQA数据集上实现了69.68%的准确率,超越了GPT-3.5上所有现有的提示工程和微调方法。此外,我们还研究了i-MedRAG在不同迭代次数和每次迭代查询数量下的扩展特性。案例研究表明,i-MedRAG能够灵活地提出后续问题以形成推理链,从而对医学问题进行深入分析。据我们所知,这是首次将追问查询整合到医学RAG中的研究。

作者**:**Xiong G., Jin Q., et al.

发表日期:2024-10-11

**◎ 发表期刊:**arXiv preprint

**◎ 原文链接:https://arxiv.org/abs/2408.00727

Figure: Overview of i -MedRAG and its comparison to RAG (MedRAG).**

06

REALM: RAG-Driven Enhancement of Multimodal Electronic Health Records Analysis via Large Language Models

****◎ 标题:****REALM:基于 RAG 的大语言模型多模态电子健康记录分析增强框架

**◎ 摘要:**多模态电子健康记录(EHR)数据的整合显著提升了临床预测能力。现有模型在利用临床记录和多变量时间序列EHR数据时,往往缺乏与临床任务相关的医学背景知识,这促使研究人员引入外部知识,特别是知识图谱(KG)。以往使用KG的方法主要关注结构化知识提取,忽视了非结构化数据模态和语义高维医学知识。为此,我们提出REALM,一个基于检索增强生成(RAG)的框架,用于增强多模态EHR表示以解决这些局限性。首先,我们使用大语言模型(LLM)编码长文本临床记录,使用GRU模型编码时间序列EHR数据。其次,我们通过提示LLM提取任务相关的医学实体,并将其与专业标注的外部知识图谱(PrimeKG)中的实体及相应医学知识进行匹配。通过与临床标准的匹配和对齐,我们的框架消除了幻觉并确保一致性。最后,我们提出了一个自适应多模态融合网络,将提取的知识与多模态EHR数据整合。在MIMIC-III死亡率和再入院任务上的大量实验表明,我们的REALM框架优于基准模型,突显了各个模块的有效性。REALM框架有助于改进医疗保健中多模态EHR数据的使用,并弥合了准确临床预测所需的细微医学背景知识差距。

作者**:**Zhu Y., Ren C., et al.

发表日期:2024-02-10

**◎ 发表期刊:**arXiv preprint

**◎ 原文链接:https://arxiv.org/abs/2402.07016

AI大模型从0到精通全套学习大礼包

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

只要你是真心想学AI大模型,我这份资料就可以无偿共享给你学习。大模型行业确实也需要更多的有志之士加入进来,我也真心希望帮助大家学好这门技术,如果日后有什么学习上的问题,欢迎找我交流,有技术上面的问题,我是很愿意去帮助大家的!

如果你也想通过学大模型技术去帮助就业和转行,可以扫描下方链接👇👇
大模型重磅福利:入门进阶全套104G学习资源包免费分享!
在这里插入图片描述

01.从入门到精通的全套视频教程

包含提示词工程、RAG、Agent等技术点
在这里插入图片描述

02.AI大模型学习路线图(还有视频解说)

全过程AI大模型学习路线

在这里插入图片描述
在这里插入图片描述

03.学习电子书籍和技术文档

市面上的大模型书籍确实太多了,这些是我精选出来的

在这里插入图片描述
在这里插入图片描述

04.大模型面试题目详解

在这里插入图片描述

在这里插入图片描述

05.这些资料真的有用吗?

这份资料由我和鲁为民博士共同整理,鲁为民博士先后获得了北京清华大学学士和美国加州理工学院博士学位,在包括IEEE Transactions等学术期刊和诸多国际会议上发表了超过50篇学术论文、取得了多项美国和中国发明专利,同时还斩获了吴文俊人工智能科学技术奖。目前我正在和鲁博士共同进行人工智能的研究。

所有的视频由智泊AI老师录制,且资料与智泊AI共享,相互补充。这份学习大礼包应该算是现在最全面的大模型学习资料了。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。

在这里插入图片描述
在这里插入图片描述

智泊AI始终秉持着“让每个人平等享受到优质教育资源”的育人理念‌,通过动态追踪大模型开发、数据标注伦理等前沿技术趋势‌,构建起"前沿课程+智能实训+精准就业"的高效培养体系。

课堂上不光教理论,还带着学员做了十多个真实项目。学员要亲自上手搞数据清洗、模型调优这些硬核操作,把课本知识变成真本事‌!

在这里插入图片描述
如果说你是以下人群中的其中一类,都可以来智泊AI学习人工智能,找到高薪工作,一次小小的“投资”换来的是终身受益!

应届毕业生‌:无工作经验但想要系统学习AI大模型技术,期待通过实战项目掌握核心技术。

零基础转型‌:非技术背景但关注AI应用场景,计划通过低代码工具实现“AI+行业”跨界‌。

业务赋能 ‌突破瓶颈:传统开发者(Java/前端等)学习Transformer架构与LangChain框架,向AI全栈工程师转型‌。

👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

在这里插入图片描述

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐