智能体开发的灵魂!记忆功能保姆级教程:彻底搞懂如何让AI“记住”上下文,精通就靠它!
在大模型应用中,记忆是一个很重要的功能模块,特别是在对话场景中,记忆能够让大模型“记住”你的对话场景和上下文。因为大模型本身是无状态的,因此对模型来说每次对话都是一次全新的对话,大模型不知道你之前说了什么;因此,大模型就像一个拥有健忘症的人。
“ 大模型是无状态的,而记忆的本质只是把对话记录放到对话上下文中。”
在大模型应用中,记忆是一个很重要的功能模块,特别是在对话场景中,记忆能够让大模型“记住”你的对话场景和上下文。因为大模型本身是无状态的,因此对模型来说每次对话都是一次全新的对话,大模型不知道你之前说了什么;因此,大模型就像一个拥有健忘症的人。
但在实际开发过程中,特别是使用一些开发框架之后,我们很多人都被记忆模块开发给带偏了,甚至很多人都没弄明白记忆的本质到底是什么。
大模型记忆功能
再次强调一个概念,对用户来说与大模型的唯一交互窗口只有提示词(prompt);虽然这句话说的并不是完全准确,但从开发的过程来说基本上属于准确的。
原因就在于,不论是我们设置系统提示词,还是用户输入,亦或者是记忆,工具调用等;最终在输入大模型时,都会被封装到提示词中,因此才有了对用户来说与大模型唯一的交互窗口只有提示词。但与大模型交互其它还有其它参数,如温度等。
那大模型的记忆功能到底是什么?
虽然说对话记忆最终也要被封装到提示词中,但对记忆功能来说还是有一定的格式要求的,特别是在对话场景中;毕竟在某些场景下,是不需要记忆功能的。
在大模型对话中主要有三个角色,system-系统角色,human-用户角色和assistant-AI(模型)角色。
首先,系统角色的作用是设定大模型当前的角色类型;比如说是技术大佬,是营销专家;因为大模型的训练数据比较复杂,就类似于一个高中生,学了政治历史物理化学等多门学科,而有些话题需要限定在某个学科下,这个就是角色类型。
而用户角色就很容易理解了,用户就是使用者,也就是我们,我们不论是提出问题还是增加一些背景描述都属于用户角色的范畴。
而模型角色就是指模型本身,模型就是用模型角色来回答或处理用户的问题。
因此,在对话场景中记忆一般都是以下格式:
SystemMessage: 模型的系统角色
由于会存在多轮对话,因此会有多个HumanMessage和AIMessage,因此一般记忆都是使用数组进行存储;但注意点是,SystemMessage只会有一个,原因就是系统角色只需要设置一次。
如果是在智能体中,可能还会存在工具调用的结果,因此还会有一个工具消息。
虽然说记忆功能只需要把对话历史丢到提示词中即可,但由于模型上下文窗口的限制,以及从成本的角度考虑,一般会对记忆进行优化;比如说,只保存最近n次的对话记录,亦或者对整个对话记录进行总结提炼,以减少记忆超长等问题的出现。
而根据记忆存储的方式也分为长期记忆和短期记忆,所谓的长期记忆就是把记忆保存到数据库中,如向量数据库,传统数据库,redis等等;而短期记忆就是把记忆保存到内存中,随着系统的重启或超时会丢失。
如何学习大模型 AI ?
我国在AI大模型领域面临人才短缺,数量与质量均落后于发达国家。2023年,人才缺口已超百万,凸显培养不足。随着Al技术飞速发展,预计到2025年,这一缺口将急剧扩大至400万,严重制约我国Al产业的创新步伐。加强人才培养,优化教育体系,国际合作并进,是破解困局、推动AI发展的关键。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
2025最新大模型学习路线
明确的学习路线至关重要。它能指引新人起点、规划学习顺序、明确核心知识点。大模型领域涉及的知识点非常广泛,没有明确的学习路线可能会导致新人感到迷茫,不知道应该专注于哪些内容。
对于从来没有接触过AI大模型的同学,我帮大家准备了从零基础到精通学习成长路线图以及学习规划。可以说是最科学最系统的学习路线。
针对以上大模型的学习路线我们也整理了对应的学习视频教程,和配套的学习资料。
大模型经典PDF书籍
新手必备的大模型学习PDF书单来了!全是硬核知识,帮你少走弯路!
配套大模型项目实战
所有视频教程所涉及的实战项目和项目源码等
博主介绍+AI项目案例集锦
MoPaaS专注于Al技术能力建设与应用场景开发,与智学优课联合孵化,培养适合未来发展需求的技术性人才和应用型领袖。
这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费
】
为什么要学习大模型?
2025人工智能大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用 , 大模型作为其中的重要组成部分 , 正逐渐成为推动人工智能发展的重要引擎 。大模型以其强大的数据处理和模式识别能力, 广泛应用于自然语言处理 、计算机视觉 、 智能推荐等领域 ,为各行各业带来了革命性的改变和机遇 。
适合人群
- 在校学生:包括专科、本科、硕士和博士研究生。学生应具备扎实的编程基础和一定的数学基础,有志于深入AGI大模型行业,希望开展相关的研究和开发工作。
- IT行业从业人员:包括在职或失业者,涵盖开发、测试、运维、产品经理等职务。拥有一定的IT从业经验,至少1年以上的编程工作经验,对大模型技术感兴趣或有业务需求,希望通过课程提升自身在IT领域的竞争力。
- IT管理及技术研究领域人员:包括技术经理、技术负责人、CTO、架构师、研究员等角色。这些人员需要跟随技术发展趋势,主导技术创新,推动大模型技术在企业业务中的应用与改造。
- 传统AI从业人员:包括算法工程师、机器视觉工程师、深度学习工程师等。这些AI技术人才原先从事机器视觉、自然语言处理、推荐系统等领域工作,现需要快速补充大模型技术能力,获得大模型训练微调的实操技能,以适应新的技术发展趋势。
课程精彩瞬间
大模型核心原理与Prompt:掌握大语言模型的核心知识,了解行业应用与趋势;熟练Python编程,提升提示工程技能,为Al应用开发打下坚实基础。
RAG应用开发工程:掌握RAG应用开发全流程,理解前沿技术,提升商业化分析与优化能力,通过实战项目加深理解与应用。
Agent应用架构进阶实践:掌握大模型Agent技术的核心原理与实践应用,能够独立完成Agent系统的设计与开发,提升多智能体协同与复杂任务处理的能力,为AI产品的创新与优化提供有力支持。
模型微调与私有化大模型:掌握大模型微调与私有化部署技能,提升模型优化与部署能力,为大模型项目落地打下坚实基础。
顶尖师资,深耕AI大模型前沿技术
实战专家亲授,让你少走弯路
一对一学习规划,职业生涯指导
- 真实商业项目实训
- 大厂绿色直通车
人才库优秀学员参与真实商业项目实训
以商业交付标准作为学习标准,具备真实大模型项目实践操作经验可写入简历,支持项目背调
大厂绿色直通车,冲击行业高薪岗位
文中涉及到的完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费
】
更多推荐
所有评论(0)