目录

第一篇:认知与方法论——洞察 AI 的新边界

第 1 章:RAG 时代的降临:为什么它不可或缺

  • 1.1 大模型的“三大软肋”:幻觉问题、时效性滞后与私域数据真空。

  • 1.2 RAG 的诞生背景:从“博学却健忘”的模型到“带着资料去考试”的系统。

  • 1.3 核心价值主张:低成本、高可控、易回溯的企业级 AI 落地路径。

  • 1.4 RAG 学习全景图:从新手入门到架构师的五个必经阶段。

第 2 章:辨析与定位:RAG 与其它的技术博弈

  • 2.1 RAG 与微调(Fine-tuning):谁是“学霸”,谁是“开卷考试”?

  • 2.2 长上下文(Long Context)的挑战:200K 甚至 2M 的窗口会取代 RAG 吗?

  • 2.3 插件与工具调用:RAG 仅仅是模型的一个插件吗?

  • 2.4 RAG 适合的场景清单:从知识库问答、自动化报告到智能法律顾问。

第二篇:基石技术体系——构建 RAG 的三大支柱

第 3 章:语言模型(LLM)的选型与部署

  • 3.1 模型的心脏:Token 机制与上下文窗口的工程影响。

  • 3.2 选型逻辑:闭源 API(GPT-4/Claude)与开源模型(Llama/DeepSeek)的权衡。

  • 3.3 本地化推理:使用 Ollama 与 vLLM 在企业内网拉起你的大模型。

  • 3.4 模型适配:针对检索结果的指令遵循能力(Instruction Following)。

第 4 章:Embedding 嵌入模型:语义的度量衡

  • 4.1 向量化的本质:如何将万物皆可转化为数字坐标。

  • 4.2 中文适配的坑:为什么不能直接照搬国外的 Embedding 模型。

  • 4.3 重排模型(Reranker):从“大概相关”到“精准命中”的关键一步。

  • 4.4 部署实战:构建高性能的向量生成服务。

第 5 章:向量数据库:AI 的长期记忆体

  • 5.1 存储革命:为什么传统数据库处理不了高维向量。

  • 5.2 索引算法白话谈:HNSW 与 IVF 是如何让搜索快如闪电的。

  • 5.3 主流选型对比:Chroma(轻量)、Milvus(分布式专家)与向量插件。

  • 5.4 混合检索(Hybrid Search):语义向量与关键词搜索的强强联合。

第三篇:企业文档工程——垃圾进,垃圾出

第 6 章:文档解析与清洗的艺术

  • 6.1 解析“深水区”:处理 PDF 表格、图片中的文字(OCR)与复杂排版。

  • 6.2 RAGFlow 深度剖析:基于视觉的文档识别技术原理。

  • 6.3 数据清洗规范:去除噪声、修复乱码与结构化提取。

第 7 章:分块策略(Chunking)的深度工程

  • 7.1 固定分块与重叠:最简单但有效的初始策略。

  • 7.2 语义分块(Semantic Chunking):让每一块内容都保持逻辑完整。

  • 7.3 父子块模式(Parent-Child):小块检索,大块喂给模型。

  • 7.4 文档元数据(Metadata):给数据打标签,实现精准范围过滤。

第四篇:检索增强进化——从 Baseline 到卓越

第 8 章:构建 Baseline RAG 系统

  • 8.1 典型 Pipeline 全过程:提问 -> 检索 -> 提示词注入 -> 生成。

  • 8.2 Prompt Engineering:如何写出让模型不“胡言乱语”的约束指令。

  • 8.3 流式输出(Streaming):提升用户感知的交互设计。

第 9 章:高级检索优化技术

  • 9.1 查询改写(Query Rewrite):帮用户把“烂问题”修成“好问题”。

  • 9.2 多路召回(Multi-way Retrieval):多索引、多策略的融合之道。

  • 9.3 自适应检索(Self-RAG):让系统学会反思,资料不够就不瞎答。

第五篇:拓展范式——Graph RAG 与 Agentic RAG

第 10 章:Graph RAG:知识图谱驱动的深度检索

  • 10.1 为什么需要图:解决跨文档、跨实体的超复杂逻辑推理。

  • 10.2 知识三元组提取:从非结构化文本中抽取出“谁是谁的谁”。

  • 10.3 Graph RAG 架构实战:将图数据库(Neo4j)接入检索流程。

第 11 章:Agentic RAG:智能体驱动的自主系统

  • 11.1 Agent 的本质:赋予 RAG 系统规划与决策的权力。

  • 11.2 多 Agent 路由:自动判断该去哪个知识库查,该用哪个工具。

  • 11.3 反思与修正循环:如果第一次搜错了,智能体如何自我纠正。

第六篇:质量评估与微调——科学的迭代之路

第 12 章:RAG 评估体系:Ragas 与真实世界

  • 12.1 评估三大支柱:忠诚度、相关性、完备性。

  • 12.2 构建黄金测试集:如何用大模型自动生成高质量的考卷。

  • 12.3 端到端监控:在生产环境中捕捉用户的负面反馈。

第 13 章:RAG 专项微调:极致性能的追求

  • 13.1 Embedding 微调:让向量模型听懂你行业的“行话”。

  • 13.2 生成微调(SFT):规范模型的输出格式,告别废话。

  • 13.3 数据飞轮:如何利用检索日志持续进化系统。

第七篇:工程化落地——迈向真正的企业级产品

第 14 章:接口、架构与前端集成

  • 14.1 高性能 API 架构:基于 FastAPI 的并发优化与负载均衡。

  • 14.2 前端交互设计:引用来源高亮、图表联动与溯源。

  • 14.3 异步处理:解决超长文档解析的超时问题。

第 15 章:安全、监控与商业化

  • 15.1 数据脱敏与权限:如何实现“张三不能查李四的文档”。

  • 15.2 成本控制:Token 消耗监控与语义缓存(Semantic Cache)。

  • 15.3 商业化路径:从工具交付到 AI 原生产品的转型。

附录

  • A. RAG 术语全汇编

  • B. 向量算法对照表(从暴力搜索到 HNSW)

  • C. 企业级 RAG 架构设计模板

  • D. 常用 Prompt 模版库

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐