【下面是我个人的一个学习计划】

LLM+RAG+向量数据库+Agent快速商业落地的学习路径

在实际的应用开发中,LLM大语言模型在训练完成后为了能够适应本地化部署,适应企业的专业领域的知识短板,如果一上来就考虑对LLM大模型的微调,那么这个成本动辄十几万,甚至更大。因此有没有成本更低效率更高的方式解决大模型的幻觉和知识短板问题呢?经过2025年很多业内企业的实践证明,LLM+RAG+向量数据库+Agent快速商业落地的方式,这种方式不仅可以快速的商业落地且成本低。
专业背景(有 NLP 基础 + 强后端/工程能力+python和Java,或者大数据基础的工程师)非常适合系统性地切入 LLM + RAG + 向量数据库 + Agent 这一整套能力栈。下面我给你一个工程视角 + 学习路线图式的回答。


下面是我个人的一个学习计划

一、AI 领域常见的向量数据库(Vector DB)

1️⃣ 主流向量数据库一览(你应该重点关注的)

向量数据库 特点 适合学习/实战
Milvus 国人主导、开源、工业级、生态完整 ⭐⭐⭐⭐⭐(强烈推荐)
FAISS Meta 出品,库级工具,速度快 ⭐⭐⭐⭐
Qdrant Rust 编写,API 友好 ⭐⭐⭐⭐
Weaviate Graph + Vector,语义关系强 ⭐⭐⭐
Pinecone SaaS 化、免运维 ⭐⭐⭐
Chroma 轻量、本地、适合学习 ⭐⭐⭐⭐⭐(入门)

👉 一句话建议

  • 学习入门:Chroma / FAISS
  • 工程实战:Milvus / Qdrant
  • 产品验证:Pinecone(省运维)

2️⃣ 向量数据库的本质你要搞清楚的 4 件事

向量数据库 ≠ 存数据
它本质是:高维向量的近似最近邻搜索系统(ANN)

你要重点理解:

  1. Embedding 是什么

    • text → vector(768 / 1024 / 1536 维)
  2. 相似度计算

    • Cosine / Inner Product / L2
  3. 索引结构

    • IVF、HNSW、PQ(这是“算法核心”)
  4. 检索策略

    • TopK、过滤、混合检索(Hybrid Search)

二、LLM + RAG 的完整技术链路(重点)

🔗 标准 RAG 架构(你未来 80% 项目都会是这个)

原始数据
 ↓
文本清洗 / 切分(Chunk)
 ↓
Embedding 模型
 ↓
向量数据库
 ↓
相似度召回(TopK)
 ↓
Rerank(可选)
 ↓
Prompt 拼接
 ↓
LLM 生成答案

1️⃣ 你需要重点掌握的 RAG 技术点

(1)文本切分(90% 的效果来自这里
  • 固定长度
  • 语义切分(Markdown / 标题)
  • Overlap(非常关键)
(2)Embedding 模型(不追大而追“稳”)
  • OpenAI text-embedding-3-large
  • bge-large-zh / bge-m3(中文)
  • E5 / Instructor
(3)Rerank(从“能用”到“好用”的分水岭)
  • Cross-Encoder
  • bge-reranker
  • Cohere Rerank

三、Agent 是什么?你应该怎么学

Agent ≠ 聊天机器人

Agent = LLM + 规划 + 工具调用 + 记忆

典型 Agent 架构

User Goal
 ↓
LLM(思考 / 拆解)
 ↓
Planner(任务规划)
 ↓
Tool Calling
 ↓
Observation
 ↓
Memory
 ↓
Final Answer

你应该重点学的 Agent 能力

能力 说明
Tool Calling API / DB / 搜索
Memory Short-term / Long-term(向量库)
Planning ReAct / Plan-and-Execute
多 Agent Manager-Agent / Worker-Agent

👉 工程上 Agent 90% = RAG + 工具 + 状态机


四、你该重点学习哪些框架(按价值排序)

1️⃣ RAG / Agent 框架

框架 作用
LangChain RAG / Agent 标准
LlamaIndex 数据索引 & RAG
Dify 企业级 RAG / Agent 平台
Haystack NLP + RAG

2️⃣ 你“必须理解而不是死用”的核心概念

  • Prompt Engineering(结构化 Prompt)
  • Function / Tool Calling
  • Streaming 输出
  • Context Window 管理
  • Token 成本控制

五、给你一条【非常务实】的学习路径(3 阶段)

🚀 第一阶段(1–2 周):RAG 基础闭环

目标:能跑起来

  • Embedding + Chroma
  • 简单文本 → 问答
  • 用 LangChain / LlamaIndex

🚀 第二阶段(1 个月):工程级 RAG

目标:像产品

  • Milvus / Qdrant
  • Chunk 策略 + Rerank
  • 多文档 / 权限隔离
  • 评估指标(Recall@K)

🚀 第三阶段(1–3 个月):Agent + 场景

目标:能赚钱 / 能落地

  • Agent + RAG
  • Tool Calling(DB / API)
  • 多 Agent 协作
  • 真实业务(客服 / 销售 / 知识库)

六、项目实战目标

做这三类项目练手:

1️⃣ 企业知识库 + RAG + Agent
2️⃣ 销售 / 客户角色模拟(已经在做)
3️⃣ 语音 → 文本 → RAG → 结构化输出

这三者 技术栈高度复用


Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐