文章详解智能体设计模式中的知识检索(RAG)模式,阐述其索引、检索、生成三阶段核心流程。RAG通过整合外部信息弥补LLM知识局限,面临工程挑战与未来演进方向,包括Agentic RAG、多模态融合及知识图谱结合。代码示例展示RAG与记忆管理的融合实践,为智能体提供从"被动信息补充"到"自主认知决策"的能力跃升。


智能体具有自主性、主动性、反应性等核心特质,涉及状态跨步骤维持、工具使用决策、多智能体通信协调、意外情况处理等一系列复杂问题,这些都为其开发带来了显著挑战。显然,这些挑战单靠一个强大的模型是远远不够的,还需要结构、设计、以及一套经过深思熟虑的方法,来指导智能体如何感知、规划、行动和交互。而智能体设计模式作为经实践验证的模板与蓝图,正是应对这些挑战的关键:它们并非僵化规则,而是针对智能体领域标准设计与实现难题的成熟解决方案。本系列文章将解读《智能体设计模式:构建智能系统的实战指南》中的21个设计模式,覆盖结构化顺序操作(提示链)、外部交互(工具使用)等基础概念,到协同工作(多智能体协作)、自我改进(反思)等进阶主题。

本篇文章,将介绍第十四个模式,知识检索(RAG)。

纵怀胸中韬略,仍需斥候探报

古代军师运筹帷幄,自身熟稔兵法韬略(对应 LLM 的基础能力),但战场形势瞬息万变,单凭旧典兵书不足以决胜。此时需依赖 斥候探马的实时情报—— 敌军粮草多少、营寨布防、主将性情,将这些 “外部实时信息” 融入谋略,才能制定出 “因地制宜、因敌施策” 的计策。

同理,大语言模型(LLM)的内蕴之才,往往受限于其训练数据,使其无法获取实时信息、特定的公司数据或高度专业化细节的能力。知识检索(RAG)作为外接之识使得LLM能够访问并整合外部的、当前的、特定上下文的信息,从而增强其输出的准确性、相关性和事实基础。

RAG的基础范式可以被概括为三个核心阶段:索引(Indexing)、检索(Retrieval)与生成(Generation)。

第一阶段:索引

索引是RAG性能的基石,核心是将企业私域文档、实时数据流等非结构化外部知识,通过文档解析提取纯文本、文本分块适配LLM上下文窗口、语义量化(借预训练模型转文本块为向量),最终构建向量索引库,为后续高效检索奠定基础。

第二阶段:检索

检索是用户意图与知识库的连接桥梁,先将用户自然语言查询转成查询向量,再用余弦相似度等方法,在向量索引库中匹配并排序,返回最相关的Top-K知识块,作为生成阶段的事实依据。

第三阶段:生成

生成是RAG价值的最终体现,将检索到的知识块与用户查询整合为增强提示词(含上下文、问题及回答指令),发送给LLM后,由LLM综合、推理这些信息,生成流畅且基于事实的最终回答。

尽管RAG的基础范式逻辑非常清晰,但是在将其从原型转化为稳定、高效的生产系统的工程化实践中,从业人员仍然面临一系列贯穿于数据处理、查询理解、召回匹配和复杂推理全链路的工程挑战。

这些挑战包括:知识单元的完整性与信息密度的抉择,难以精准捕捉模糊、多样的用户意图,召回匹配时难以兼顾语义相关性与关键词准确性,需要探索如何在检索精度与完整性之间取得平衡,应对需要多知识点综合推理的查询实现等。

因此,业界也再考虑其他范式。

吾将上下而求索

业界认为,RAG的未来将沿着Agentic RAG、多模态RAG以及与知识图谱的深度融合这三个方向演进,成为一个能够自主规划信息需求、理解并交互于多元世界、并在机构化知识之上进行深度推理的强大认知内核。

在Agentic RAG方面,即将信息检索的主动权从AI应用开发者手中,移交给Agent本身。一个兼具记忆框架能力的非典型型RAG框架为MemU,引入一个自主代理Agent来管理记忆(知识)。MemU使用类似文件系统的设计,把长期记忆整理成一组Md文件,模型可以直接读取这些文件来思考。在检索上,MemU支持两种方式,一是传统的向量检索,二是基于大模型的非向量检索,直接读取相关文档进行推理,语义准确定更高。

在多模态RAG以及知识图谱方面,Supermemory是一套面向AI应用的通用记忆API,同样也可以认为是下一代的非典型RAG框架。Supermemory通过自研向量数据库、内容解析器、知识图谱以及丰富的SDK/Connector,帮助个人和企业实现夸会话、跨模型、可支持的记忆。

未来的RAG体系大抵会和记忆体系深度融合和绑定,其内在逻辑在于:对智能体而言,记忆的本质是个性化、时序化的信息沉淀,而知识的本质是结构化、通用化的信息集合,二者都是“信息的存储-关联-调用”,核心诉求均是让智能体高效获取有效信息。当然这种融合并非简单的功能得加,而是围绕信息价值最大化形成的逻辑闭环。首先信息形态统一,无论是MemU的Md记忆文件,还是Supermemory的多模态数据,均被纳入结构化管理,打破记忆与知识的存储差异;其次是主动权归一,Agent既主导记忆的归档、更新与遗忘,又根据信息属性选择适配的检索方式(如MemU的双检索模式),实现信息管理-检索调用的自主协同;最后是价值相互反哺,记忆的个性化特质(如用户偏好、交互时序)能指导知识检索的精准度,而知识图谱的结构化关联能优化记忆的组织逻辑,让信息的“存储-调用-迭代”形成正向循环。

最终,这种深度融合将让RAG与记忆体系共生为智能体的核心认知基座,支撑其从“被动信息补充”向“自主认知决策”跨越。

动手实践

演示一下如何从零到一实现知识检索模式,有助于我们加深理解。

import numpy as np
原生实现 RAG+记忆管理融合|无框架|贴合MemU/Supermemory核心逻辑
class RagWithMemory:
def init(self):
self.memory_knowledge = []  # 统一存储:记忆项+知识项 结构化信息集合
self.vec_lib = []            # 向量索引库,与记忆知识库一一映射
def text2vec(self, text):  # 极简语义量化(对应索引阶段-语义转向量)
return np.array([hash(w) % 100 for w in text.split()])[:10]
def add(self, info):  # 记忆/知识统一新增归档|信息形态统一管理
self.memory_knowledge.append(info)
self.vec_lib.append(self.text2vec(info))
def cos_sim(self, a, b):  # 余弦相似度|检索阶段核心匹配逻辑
return np.dot(a, b) / (np.linalg.norm(a) * np.linalg.norm(b) + 1e-6)
def retrieve(self, query, top_k=1):  # 自主检索|返回高相关记忆/知识
q_vec = self.text2vec(query)
scores = [self.cos_sim(q_vec, v) for v in self.vec_lib]
idx = np.argsort(scores)[-top_k:][::-1]
return [self.memory_knowledge[i] for i in idx]
def generate(self, query):  # 检索增强生成|最终价值输出
context = self.retrieve(query)
return f"基于记忆与知识推理:{query} → {''.join(context)}"
测试:记忆归档+知识检索+增强生成 闭环
rag_mem = RagWithMemory()
rag_mem.add("用户偏好:只看科幻类电影,喜欢星际穿越")  # 个性化记忆项
rag_mem.add("知识:星际穿越导演是诺兰,核心主题是亲情与时空") # 结构化知识项
print(rag_mem.generate("用户喜欢的电影相关知识是什么?"))

AI时代,未来的就业机会在哪里?

答案就藏在大模型的浪潮里。从ChatGPT、DeepSeek等日常工具,到自然语言处理、计算机视觉、多模态等核心领域,技术普惠化、应用垂直化与生态开源化正催生Prompt工程师、自然语言处理、计算机视觉工程师、大模型算法工程师、AI应用产品经理等AI岗位。

在这里插入图片描述

掌握大模型技能,就是把握高薪未来。

那么,普通人如何抓住大模型风口?

AI技术的普及对个人能力提出了新的要求,在AI时代,持续学习和适应新技术变得尤为重要。无论是企业还是个人,都需要不断更新知识体系,提升与AI协作的能力,以适应不断变化的工作环境。

因此,这里给大家整理了一份《2026最新大模型全套学习资源》,包括2026最新大模型学习路线、大模型书籍、视频教程、项目实战、最新行业报告、面试题、AI产品经理入门到精通等,带你从零基础入门到精通,快速掌握大模型技术!

由于篇幅有限,有需要的小伙伴可以扫码获取!
在这里插入图片描述

1. 成长路线图&学习规划

要学习一门新的技术,作为新手一定要先学习成长路线图,方向不对,努力白费。这里,我们为新手和想要进一步提升的专业人士准备了一份详细的学习成长路线图和规划。

在这里插入图片描述

2. 大模型经典PDF书籍

书籍和学习文档资料是学习大模型过程中必不可少的,我们精选了一系列深入探讨大模型技术的书籍和学习文档,它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础(书籍含电子版PDF)

在这里插入图片描述

3. 大模型视频教程

对于很多自学或者没有基础的同学来说,书籍这些纯文字类的学习教材会觉得比较晦涩难以理解,因此,我们提供了丰富的大模型视频教程,以动态、形象的方式展示技术概念,帮助你更快、更轻松地掌握核心知识

在这里插入图片描述

4. 大模型项目实战

学以致用 ,当你的理论知识积累到一定程度,就需要通过项目实战,在实际操作中检验和巩固你所学到的知识,同时为你找工作和职业发展打下坚实的基础。

在这里插入图片描述

5. 大模型行业报告

行业分析主要包括对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

在这里插入图片描述

6. 大模型面试题

面试不仅是技术的较量,更需要充分的准备。

在你已经掌握了大模型技术之后,就需要开始准备面试,我们将提供精心整理的大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。

在这里插入图片描述

为什么大家都在学AI大模型?

随着AI技术的发展,企业对人才的需求从“单一技术”转向 “AI+行业”双背景。企业对人才的需求从“单一技术”转向 “AI+行业”双背景。金融+AI、制造+AI、医疗+AI等跨界岗位薪资涨幅达30%-50%。

同时很多人面临优化裁员,近期科技巨头英特尔裁员2万人,传统岗位不断缩减,因此转行AI势在必行!

在这里插入图片描述

这些资料有用吗?

这份资料由我们和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。

在这里插入图片描述
在这里插入图片描述

大模型全套学习资料已整理打包,有需要的小伙伴可以微信扫描下方CSDN官方认证二维码,免费领取【保证100%免费】

在这里插入图片描述

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐