最近一段时间,我听到两种完全相反的抱怨。

一边是做业务的同事说:

“现在的大模型越来越会说,但不一定说得对,尤其是遇到我们行业里的细节问题。”

另一边是做技术的同事说:

“其实模型的表达能力很强,只是它不知道你们公司内部的规则和最新资料。”

这中间的“断层”,正是今天这一期要聊的主角:

RAG(检索增强生成),以及它和 Prompt 的关系。

简单说,RAG 就是给大模型接上一套「外脑」——让它不再只靠自己“背过的东西”,而是像一个会查资料、会读文档的助理,带着你的知识库一起工作。


一、为什么光靠大模型记忆不够用了?

如果把大模型比作一个人,它更像是:

“记过无数书、参加过无数考试,但毕业那天就不再更新知识的学霸。”

它的局限大概有三类:

  1. 知识有时间截点
  • 训练完成的那一刻之后发生的事,它不知道,
  • 法规新修订、行业新标准、公司新政策,对它来说都还是“未来式”。
  1. 不了解你的“内部情况”
  • 公司的流程、SOP、产品私有文档、历史项目记录,
  • 这些都不会出现在公开训练数据里,它当然也没学过。
  1. 即使不知道,也会一本正经地回答
  • 大模型是“被训练出来要给出答案”的,
  • 很少会主动承认“我不知道”,而是倾向于“合理猜测”。

这就导致一个尴尬的现实:

  • 让它写一篇职场鸡汤,问题不大;
  • 让它回答“新国标”、“最新监管要求”、“公司内部审批细则”,风险就很大。

RAG 想解决的,就是这类「模型知道得不够、但我们手上有材料」的问题。


二、用通俗话解释:RAG 到底在干什么?

把 RAG 拆开看,其实就是一句话:

在大模型回答问题之前,先帮它查一遍靠谱的资料

整个过程可以类比成一个公司里的“实习生 + 图书管理员”组合:

1、你问问题

就像你对实习生说:“帮我看看这份新合同有没有风险。”

2、实习生不会直接“瞎说”

他先去找图书管理员,让对方从公司资料柜里把这些东西找出来:

  • 最新的合同范本
  • 法务部出的风险提示
  • 相关的监管文件摘要

3、拿着资料再给你答案

实习生不会只凭“印象”回答,而是对着这些资料,结合你提的问题,说出一套相对靠谱的分析。

技术上,RAG 大致分三步:

  • “切文档”:把长文档拆成一块块“知识片段”(几百字一段),方便检索。
  • “找片段”:当你提问时,用向量检索之类的方法,从知识库里找到最相关的几段。
  • “带着资料回答”:把这几段资料 + 你的问题,一起塞给大模型,让它基于这些内容组织语言。

注意一个关键点:

真正给出最终答案的,还是大模型;
但它参考的“底稿”,来自你的知识库。

这就是为什么很多人说:

RAG = 大模型的“外脑”。


三、Prompt 在 RAG 里,不是配角,而是「指挥官」

很多人一提 RAG,就只想到“向量库”“embedding”“检索算法”,但在实际落地中,Prompt 写得好不好,往往决定了效果是否可用。

在一个典型的 RAG 应用里,Prompt 至少扮演三种角色:

  1. 提问重写:帮模型把“问题问清楚”

我们平时的说话方式,经常是模糊的。

例如员工随手在系统里发一句:

“看看这个新规对我们有什么影响?”

如果直接拿这句话去检索,命中率会很差。

更合理的做法是:

由一个专门的 Prompt,把这句自然语言“翻译”成更适合检索的查询:

  • 明确领域:是税务?数据?环保?
  • 点出关键词:哪部法规?哪条条款?
  • 带上时间信息:今年?去年?哪次修订?

这个过程,本质上就是 Prompt 在帮你做「问题澄清」。

很多优秀的 RAG 系统,内部其实有一个专门的“Query Prompt”,负责把用户的随口一问,变成适合搜索引擎理解的问题。

  1. 答案约束:告诉模型“只能按资料说话”

RAG 最大的意义在于“有据可依”,

这就要求 Prompt 必须给出清晰的“纪律”:

  • 只能基于给定文档回答,
  • 文档里没写到的内容,要明确说“资料中未找到”,
  • 不能根据常识擅自发挥,更不能编数据。

一个常用的 Prompt 写法是:

“你接下来看到的是若干资料片段,请你只基于这些资料回答问题;如果资料中没有相关信息,请明确说明‘资料中未包含该信息’,不要自行推断。”

简单的一句话,能大幅降低“看起来好像对,其实哪都对不上原文”的风险。

  1. 输出编排:把“资料碎片”整理成“可用答案”

检索出来的内容往往是碎片化的,比如:

  • 一个文件第 3 页的一段定义;
  • 另一个文件第 15 页的一条注意事项;
  • 再加上一份内部说明里的特别约定。

如果放任模型自由发挥,很容易变成一大段“抄袭+拼接”,读起来吃力,也很难直接落到执行。

这时候,Prompt 要像编辑一样,规定清楚输出结构,例如:

  • 先写 3 行摘要结论;
  • 再按「政策要求 / 公司现状 / 风险提示 / 建议行动」分段;
  • 每个重点后面注明资料来源(文件名 + 页码或章节)。

这样的输出,才是真正能直接进邮件、进 PPT、进汇报的内容。


四、三个真实感很强的使用场景

为了方便你在脑海里“过电影”,下面用三个常见岗位做例子。

场景一:法务——从“盯全文”到“看重点”

你是公司法务,要审一份新的供应商合同。

你手头有:

  • 公司统一合同范本(最新版)
  • 行业协会最新发布的风险提示
  • 这次合作的实际合同文本

过去做法:

从头到尾看一遍合同,再和范本逐条对比,

有时候看三份文件就要好几个小时。

接入 RAG 后,你可以这样设计 Prompt:

“你是一名公司法务专员。你可以访问:

  • 公司《采购合同范本》(2025 版)
  • 行业协会《供应链合规风险提示》
  • 本次合作的实际合同文本

任务:找出本次合同中,相对于公司范本的‘不利变更’和行业常见风险。
要求:

  1. 只依据上述三类文档;
  2. 每条风险后注明对应文档和条款位置;
  3. 按重要程度从高到低排序;
  4. 输出为表格:序号 / 风险点描述 / 出处 / 初步建议。”

这时,大模型做的事情就不再是“泛泛而谈”,而是:

真正对照范本和行业指引,

把那些“和我们标准不一样的地方”逐条列出来。

你最后要做的,不是从零审一份合同,而是对着它列出的十条重点,逐条判断是否接受。

场景二:市场/运营——从“翻盘子”到“问结果”

你是一名运营,需要做一份“近半年活动效果复盘”。

你手头有:

  • 活动投放数据导出的 CSV 表
  • CRM 系统里导出的用户留存数据
  • 之前类似活动的复盘文档

你给系统的 Prompt 可以是:

“你是一名数据敏感的运营。请基于我提供的这三类数据和文档,完成一次活动效果分析:

  1. 提取本次活动的关键指标:曝光、点击、转化、留存;
  2. 和过去三次同类活动做对比,找出 3 个以上显著差异;
  3. 结合历史复盘中的经验,给出 3 条可以立刻行动的改进建议。
    要求:
  • 每一个结论后,都要注明对应的数据来源(文件名 + 指标);
  • 不允许虚构任何数字。”

这里,大模型不是“自己想象活动有多好”,

而是被强制拉回你的真实数据和历史记录上。

你得到的,已经不再是一堆“套话式总结”,

而是一份“带出处的分析框架”,可以直接拿来和团队讨论。

场景三:培训/知识管理——从“问谁都不太清楚”到“有据可查”

你是 HRD,要为公司中层做一门“新管理流程”培训。

资料来源包括:

  • 公司最新管理手册 PDF
  • 去年高层对管理要求的讲话整理
  • 各部门交上来的实际执行细则

你可以这样用 RAG:

“你是一名内部培训讲师。请基于以下文档,整理一份《新管理流程中,中层必须清楚的 10 件事》。
要求:

  • 必须全部来自公司内部文档,不引用任何外部观点;
  • 每一条都用 2~3 句话解释‘是什么’和‘为什么’;
  • 适合在 PPT 中以一页一条的方式展示。”

这样的结果,不仅节省了你翻资料的时间,也让培训内容和公司实际保持一致。


五、如果你想自己搭一个“小型 RAG”,可以这么开始

很多人一听“知识库”“向量检索”,下意识就退缩了。

实际上,从 0 到 1 的门槛已经被工具压得很低,你可以按这样的节奏来:

第一步:先整理“我最常查的那一摞资料”

不要贪多,先搞清楚:

  • 你这半年最常翻的 5–10 份文档是什么?

比如:制度手册、合同模版、销售话术、技术 FAQ、内部培训材料。

把它们集中放进一个文件夹,

最好简单加个命名规则(如“合同_范本_2025.pdf”)。

第二步:选一个“傻瓜式”工具试水

现在有不少平台支持“上传文档 → 直接问”的模式,

你可以先用这些轻量工具熟悉流程:上传 PDF / Word → 提问 → 看效果。

第一轮你不要在意算法多先进,只用一个标准:

“它给出的内容,能不能帮我节省至少一半翻文档的时间?”

如果答案是肯定的,就值得继续打磨 Prompt。

第三步:为自己常用场景写 2–3 个 Prompt 模板

比如你是法务,可以准备这样的模板:

模板 A:合同初审

“你是一名公司法务,只能依据我上传的合同范本和行业指南。请列出本合同与范本不一致的条款,并从甲方角度评价风险程度(高/中/低)。每点后必须附上原文片段。”

模板 B:条款解释

“你是一名法律顾问,只能依据我上传的文档。请用白话解释第 X 条的含义,并举一个贴近日常业务的例子。”

以后每次审新合同,只需要:

  • 把文档拖进去,
  • 换一下合同名称、条款编号,
  • 模板直接复用。

第四步:刻意养成“结果要能对得上原文”的习惯

不要满足于“看起来挺有道理”。

对你非常重要的结论——比如合规、法律、财务类——最好做到:

  • 抽样检查:每次挑 2–3 条,让模型给出处,然后你自己打开 PDF 查一眼;
  • 做个小记录:错一次,就记下来是哪一类问题,下次优化 Prompt 或调整知识库分块方式。

这样做几轮,你会明显感到:

模型在你自己的资料里“越走越熟”,而不是只会说空话。


六、容易掉进去的几个坑

坑 1:以为“文档越多越好”

很多团队一上来就把所有东西全扔进去——

结果是模型经常从一堆过时版本里抓到“旧规定”。

更好的做法是:

  • 一次只放一类主题,比如“最新版本的人力制度”;
  • 为每个文档加上版本号和生效时间;
  • 在 Prompt 中指明“只使用最新版本的文档”。

坑 2:对“知识库”没有权限和分级概念

RAG 一旦接到内部文档,如果没有权限划分,很容易踩雷:

  • 某些合同、薪酬体系、内部敏感汇报,不该被所有人搜索到。

这不是 RAG 本身的问题,而是知识管理的问题。

建议至少做到:

  • 把文档按部门或项目分库;
  • 对“谁能查到什么”心里有数。

坑 3:过度迷信“自动化”,忽视人工判断

RAG 再聪明,也只是:

“帮你更快地找到、整理资料。”

它做不到的是:

  • 代替你对风险做最终判断;
  • 替你承担决策责任。

特别在法务、财务、合规等场景里,要时刻提醒自己:

AI 可以帮你缩短“看资料”的时间,
但不能替你承担“签字”的后果。


七、今天可以立刻开始的三个小练习

如果你愿意把这一期的内容变成具体行动,可以从这三件小事做起:

练习 1:列出你的“个人知识库清单”

拿一张纸(或一页文档),写下:

  • 最近半年,你最常翻的 5~10 份文件;
  • 这些文件的典型使用场景(比如“审合同时用”“写方案时用”)。

这张清单,就是你未来个人 RAG 的雏形。

练习 2:为一个真实任务写一个 RAG Prompt

选一个你马上要做的任务,比如:

  • 审阅一份合同;
  • 准备一场培训;
  • 写一份行业分析。

根据今天的内容,写出这样一段 Prompt:

  • 明确角色(你希望 TA 以谁的身份来分析);
  • 指出可用文档(哪些资料可以被用来回答);
  • 严格限制回答边界(只能基于文档、要给出处);
  • 规定好输出结构(方便你直接用)。

哪怕你现在手边还没有真正的 RAG 系统,这个练习也能显著提升你日后上手的速度。

练习 3:尝试一次“人工 + RAG”的联合审查

选一个你比较熟悉的文档,比如一份你自己写过的制度说明。

先用传统方式快速浏览一遍,再让一个支持文档检索的工具读一遍,问它:

“根据这份文件,总结 3 条最重要的规定,并指出容易被忽略的地方。”

对比 AI 的总结与你的理解:

  • 一致的部分说明 RAG 能帮你省时间;
  • 不一致的部分,恰好提醒你:哪些地方在原文表述上还不够清晰。

普通人如何抓住AI大模型的风口?

领取方式在文末

为什么要学习大模型?

目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用 , 大模型作为其中的重要组成部分 , 正逐渐成为推动人工智能发展的重要引擎 。大模型以其强大的数据处理和模式识别能力, 广泛应用于自然语言处理 、计算机视觉 、 智能推荐等领域 ,为各行各业带来了革命性的改变和机遇 。

目前,开源人工智能大模型已应用于医疗、政务、法律、汽车、娱乐、金融、互联网、教育、制造业、企业服务等多个场景,其中,应用于金融、企业服务、制造业和法律领域的大模型在本次调研中占比超过 30%。
在这里插入图片描述

随着AI大模型技术的迅速发展,相关岗位的需求也日益增加。大模型产业链催生了一批高薪新职业:
在这里插入图片描述

人工智能大潮已来,不加入就可能被淘汰。如果你是技术人,尤其是互联网从业者,现在就开始学习AI大模型技术,真的是给你的人生一个重要建议!

最后

只要你真心想学习AI大模型技术,这份精心整理的学习资料我愿意无偿分享给你,但是想学技术去乱搞的人别来找我!

在当前这个人工智能高速发展的时代,AI大模型正在深刻改变各行各业。我国对高水平AI人才的需求也日益增长,真正懂技术、能落地的人才依旧紧缺。我也希望通过这份资料,能够帮助更多有志于AI领域的朋友入门并深入学习。

真诚无偿分享!!!
vx扫描下方二维码即可
加上后会一个个给大家发

【附赠一节免费的直播讲座,技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等,欢迎大家~】
在这里插入图片描述

大模型全套学习资料展示

自我们与MoPaaS魔泊云合作以来,我们不断打磨课程体系与技术内容,在细节上精益求精,同时在技术层面也新增了许多前沿且实用的内容,力求为大家带来更系统、更实战、更落地的大模型学习体验。

图片

希望这份系统、实用的大模型学习路径,能够帮助你从零入门,进阶到实战,真正掌握AI时代的核心技能!

01 教学内容

图片

  • 从零到精通完整闭环:【基础理论 →RAG开发 → Agent设计 → 模型微调与私有化部署调→热门技术】5大模块,内容比传统教材更贴近企业实战!

  • 大量真实项目案例: 带你亲自上手搞数据清洗、模型调优这些硬核操作,把课本知识变成真本事‌!

02适学人群

应届毕业生‌: 无工作经验但想要系统学习AI大模型技术,期待通过实战项目掌握核心技术。

零基础转型‌: 非技术背景但关注AI应用场景,计划通过低代码工具实现“AI+行业”跨界‌。

业务赋能突破瓶颈: 传统开发者(Java/前端等)学习Transformer架构与LangChain框架,向AI全栈工程师转型‌。

image.png

vx扫描下方二维码即可
【附赠一节免费的直播讲座,技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等,欢迎大家~】
在这里插入图片描述

本教程比较珍贵,仅限大家自行学习,不要传播!更严禁商用!

03 入门到进阶学习路线图

大模型学习路线图,整体分为5个大的阶段:
图片

04 视频和书籍PDF合集

图片

从0到掌握主流大模型技术视频教程(涵盖模型训练、微调、RAG、LangChain、Agent开发等实战方向)

图片

新手必备的大模型学习PDF书单来了!全是硬核知识,帮你少走弯路(不吹牛,真有用)
图片

05 行业报告+白皮书合集

收集70+报告与白皮书,了解行业最新动态!
图片

06 90+份面试题/经验

AI大模型岗位面试经验总结(谁学技术不是为了赚$呢,找个好的岗位很重要)图片
在这里插入图片描述

07 deepseek部署包+技巧大全

在这里插入图片描述

由于篇幅有限

只展示部分资料

并且还在持续更新中…

真诚无偿分享!!!
vx扫描下方二维码即可
加上后会一个个给大家发

【附赠一节免费的直播讲座,技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等,欢迎大家~】
在这里插入图片描述

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐