从零开始:0基础 Agent 开发课

写于 2026 年 3 月
面向对象:完全没有 AI 开发经验的程序员,或Java开发、Python、前端开发想转到AI开发的程序员们。


先说结论

这门课能让你从零开始,系统掌握 AI 开发的完整技术栈——从数学基础、传统机器学习、深度学习,到大模型应用开发、Agent 构建、模型微调、生产化部署。

不需要有 AI 背景。需要的只是:会写代码


你可能有这样的困惑

2022 年底 ChatGPT 出来之后,身边越来越多的人在做 AI 相关的东西。但你打开那些教程,要么是一堆数学公式,要么上来就是各种框架名词——LangChain、LangGraph、RAG、Agent——根本不知道从哪里入手。

或者你已经会调 API 了,但一到真实项目就卡住:

  • 为什么换了几个词,模型输出质量就天差地别?
  • Agent 跑起来了,但一直在绕圈子,不知道怎么调?
  • RAG 知识库搭好了,检索出来的内容驴唇不对马嘴,怎么办?
  • Demo 效果挺好,一上生产各种崩,问题出在哪?

这些问题靠"多试几次"解决不了。需要的是系统性的理解——从 LLM 工作原理,到 Prompt 设计,到 Agent 架构,到生产化工程。

这门课就是为了解决这个问题而设计的。


学完这门课,你能做到什么

按学习进度,你会依次获得这些能力:

学完第6-7章(约2周)→ 能做:命令行版个人 AI 助手
调用 DeepSeek API,维护对话历史,让 AI 记住你说过的话。这是第一个真实可用的项目。

学完第8章(约1周)→ 能做:稳定输出你想要格式的 AI
不再靠运气,学会用 Few-shot、CoT、结构化输出让模型按你的要求输出,成功率从 60% 提升到 95%+。

学完第11章(约2周)→ 能做:自己公司文档的智能问答系统
把 PDF、Word、网页变成可查询的知识库。问"上季度销售额是多少",AI 直接从你的文档里找答案。

学完第12章(约2周)→ 能做:能自主完成多步骤任务的 Agent
不只是回答问题,而是能搜索资料、调用工具、写代码、执行任务——自动完成需要多步操作的工作。

学完第18章(约1周)→ 能做:把 AI 功能上线到真实服务
不只是 Demo,而是有错误处理、成本控制、监控告警的生产级 AI 服务。


给有经验的工程师:如果你已经有项目经验,想解决具体问题,直接跳到对应章节:

  • Agent 绕圈子停不下来 → 第12章 ReAct 终止条件 + 第13章 LangGraph 状态机
  • RAG 检索内容不相关 → 第11章 文档分块策略、混合检索、重排序
  • Demo 上生产就崩 → 第18章 错误处理、重试策略、成本控制
  • 工具调用格式错误 → 第9章 Function Calling + 第12章 Agent 调试指南

Java 工程师,你的优势比你想象的大

很多 Java 开发者觉得转 AI 要从头开始,其实不是。

你已经有的东西,在 AI 工程化阶段直接用得上:

系统设计能力:Agent 系统本质上是一个分布式异步系统。你熟悉的微服务架构、消息队列、数据库设计,在 AI 应用的生产化阶段都是核心竞争力。

工程化意识:Java 生态的测试规范、CI/CD 流程、可观测性体系,大多数 Python AI 开发者反而不重视这些。你的工程化习惯是优势,不是负担。

API 设计经验:Function Calling 的本质是给 LLM 定义函数接口。你写了多年的 API 设计经验,在工具定义上直接复用。

数据库和 SQL 经验:RAG 系统的向量数据库、Text-to-SQL 应用——这些对你来说比对纯 Python 开发者上手快得多。

你真正需要补的只有两件事:Python 语法(2-3 周搞定)和 LLM 的工作方式(读完第 6 章就够了)。

Java工程师推荐先读《Java工程师转Python AI开发:跨越指南》 — 这篇文章专门讲Java工程师转Python时的思维转变、可直接复用的优势、以及Python特有的陷阱。读完这篇,再开始第2章Python基础,效率会高很多。


这门课和其他 AI 教程有什么不同

从 0 开始,不跳步骤

很多教程假设你已经懂一些 AI 基础,直接从 LangChain 或 Agent 框架讲起。这门课从 Python 基础开始,每个概念都解释清楚再往下走。

讲原理,不只讲用法

知道怎么用 API 是第一步,知道为什么这样用才能解决问题。每章都会解释背后的原理——不是数学推导,而是"这个机制是怎么工作的"。

代码优先

每个概念都有可以直接运行的代码示例。不是伪代码,是真实可跑的代码。

完整知识体系

课程覆盖从数学基础、传统ML、深度学习,到大模型应用、Agent、微调、MLOps的完整路径。你可以根据自己的目标选择学多深。

不追热点,讲稳定的东西

AI 框架更新很快,但 Token 机制、Prompt 设计原则、RAG 架构、Agent 设计模式——这些核心概念是稳定的,学了不会过时。


课程结构:20 章,从零到生产

在这里插入图片描述

图:课程四层技术栈——从基础层(Python/数学/ML)到大模型应用层(API/Prompt/工具调用),再到 Agent 构建层(RAG/LangGraph),最终到工程化层(生产化/微调/MLOps)。

基础层(第1-5章)

章节 内容 适合人群
第1章 AI全景认知 传统ML/深度学习/强化学习的认知地图 所有人
第2章 Python基础 Python语法、asyncio、pydantic 非Python背景
第3章 数学基础 线代/微积分/概率论,AI必备最少数学 想深入AI工程
第4章 传统机器学习 sklearn/线性回归/决策树/模型评估 想走AI工程师路线
第5章 深度学习基础 神经网络/PyTorch/CNN/Transformer 想走AI工程师路线

大模型应用层(第6-10章)

章节 内容 核心价值
第6章 LLM基础 Token/Temperature/上下文窗口 理解LLM工作原理
第7章 API入门 Claude/OpenAI API调用、多轮对话 动手起点
第8章 Prompt工程 Few-shot/CoT/结构化输出 让LLM稳定完成任务
第9章 工具使用与Function Calling 工具定义/调用/错误处理 Agent的核心基础
第10章 MCP协议 工具调用标准协议,Agent生态互联 工具集成标准化

Agent构建层(第11-15章)

章节 内容 核心价值
第11章 RAG与向量数据库 知识库搭建/检索优化 企业AI落地最多场景
第12章 Agent基础 ReAct/规划/记忆/工具使用 自主决策系统
第13章 LangGraph 有状态Agent/Human-in-Loop/多Agent Agent工程化
第14章 LangChain 文档处理/Memory/可观测性 快速构建LLM应用
第15章 框架与平台对比 LangChain/LlamaIndex/AutoGen/Spring AI 选型决策

工程化层(第16-20章)

章节 内容 核心价值
第16章 模型微调 LoRA/QLoRA/SFT/数据准备 定制专属模型
第17章 MLOps与模型部署 MLFlow/推理优化/vLLM/Ollama 模型工程化
第18章 生产化部署 可靠性/成本/安全/监控 Demo到生产
第19章 AI伦理与安全 公平性/提示注入/合规 可信AI系统
第20章 前沿方向 Multi-Agent/Agentic RAG/Computer Use 技术趋势

三种学习路径

在这里插入图片描述

图:三条学习路径的章节覆盖范围——路径A(蓝,应用开发)覆盖核心章节,路径B(紫,完整路线)覆盖全部20章,路径C(橙,Java快速落地)分两阶段学习。

根据你的目标,选择合适的学习路径。

路径 A:Agent应用开发路线(推荐,约3-4个月)

目标:快速掌握 LLM 应用开发和 Agent 构建,落地实际项目。

不需要:数学基础、传统ML、深度学习(可以跳过第3-5章)

第1章(AI全景认知)
→ 第2章(Python基础)
→ 第6章(LLM基础)
→ 第7章(API入门)
→ 第8章(Prompt工程)
→ 第9章(工具使用与Function Calling)
→ 第10章(MCP协议)
→ 第11章(RAG与向量数据库)
→ 第12章(Agent基础)
→ 第13章(LangGraph)
→ 第18章(生产化部署)
→ 第19章(AI伦理与安全)

适合人群:想快速转型AI应用开发的工程师、产品技术人员、想用AI解决实际问题的开发者。


路径 B:完整AI工程师路线(约12-18个月)

目标:系统掌握AI完整技术栈,具备从应用开发到模型微调、MLOps的全链路能力。

第1章(AI全景认知)→ 第2章(Python基础)→ 第3章 → 第4章 → 第5章(基础层)
→ 第6章 → 第7章 → 第8章 → 第9章 → 第10章(大模型应用层)
→ 第11章 → 第12章 → 第13章 → 第14章 → 第15章(Agent构建层)
→ 第16章 → 第17章 → 第18章 → 第19章 → 第20章(工程化层)

适合人群:想成为AI工程师、算法工程师,或希望深入理解AI技术栈的工程师。

说明:第3-5章(数学基础/传统ML/深度学习)可以和后面的章节并行学习,不需要严格串行。


路径 C:Java工程师快速落地路线(约6-8周)

目标:用 Spring AI 在现有 Java 项目中快速落地 AI 功能,同时并行学习 Python 路线。

第一阶段(工作时间,用 Spring AI 快速落地):

第6章(LLM基础)→ 第7章(API入门)→ 第8章(Prompt工程)
→ 第15章(框架对比,重点看Spring AI部分)→ 第18章(生产化部署)

第二阶段(业余时间,打通Python主流技术栈):

第1章(Python基础)→ 第11章(RAG)→ 第12章(Agent)→ 第13章(LangGraph)

适合人群:有Java开发经验,想在不换语言的情况下快速落地AI功能的工程师。


各章节人群学习建议

不同背景的读者,每章的学习策略不同。下表帮你快速决策:

章节 初学者 Java工程师 有Python经验 想做AI工程师
第1章 AI全景认知 ✅ 必读 ✅ 必读 ✅ 必读 ✅ 必读
第2章 Python基础 ✅ 必读 ✅ 必读(重点看第15篇跨越指南) ⚡ 快速浏览,补缺 ⚡ 快速浏览
第3章 数学基础 ⏭ 可跳过 ⏭ 可跳过 ⏭ 可跳过 ✅ 建议读
第4章 传统机器学习 ⏭ 可跳过 ⏭ 可跳过 ⏭ 可跳过 ✅ 建议读
第5章 深度学习基础 ⏭ 可跳过 ⏭ 可跳过 ⏭ 可跳过 ✅ 必读
第6章 LLM基础 ✅ 必读(01-07篇) ✅ 必读(01-07篇) ✅ 必读(01-07篇) ✅ 全读
第7章 API入门 ✅ 必读 ✅ 必读 ✅ 必读 ✅ 必读
第8章 Prompt工程 ✅ 必读(01-07篇) ✅ 必读 ✅ 必读 ✅ 全读
第9章 工具调用 ✅ 必读 ✅ 必读 ✅ 必读 ✅ 必读
第10章 MCP协议 ⚡ 读01篇即可 ⚡ 读01篇即可 ⚡ 读01篇即可 ✅ 全读
第11章 RAG ✅ 必读(前5篇) ✅ 必读(前5篇) ✅ 必读(前5篇) ✅ 全读
第12章 Agent基础 ✅ 必读(01-09篇) ✅ 必读(01-09篇) ✅ 必读(01-09篇) ✅ 全读
第13章 LangGraph ✅ 必读(01-06篇) ✅ 必读(01-06篇) ✅ 必读(01-06篇) ✅ 全读
第14章 LangChain ⚡ 选读 ⚡ 选读 ⚡ 选读 ✅ 建议读
第15章 框架对比 ⚡ 读01-02篇 ✅ 必读(含Spring AI篇) ⚡ 读01-02篇 ✅ 全读
第16章 模型微调 ⏭ 可跳过 ⏭ 可跳过 ⏭ 可跳过 ✅ 必读
第17章 MLOps ⏭ 可跳过 ⚡ 选读 ⏭ 可跳过 ✅ 必读
第18章 生产化部署 ✅ 必读(01-08篇) ✅ 必读(01-08篇) ✅ 必读(01-08篇) ✅ 全读
第19章 AI伦理安全 ⚡ 读01-02篇 ⚡ 读01-02篇 ⚡ 读01-02篇 ✅ 全读
第20章 前沿方向 ⚡ 选读 ⚡ 选读 ⚡ 选读 ✅ 建议读

图例:✅ 必读 / ⚡ 选读(按需) / ⏭ 可跳过

说明:这张表是建议,不是规定。遇到感兴趣的内容随时深入,遇到暂时用不上的随时跳过。课程的章节设计支持非线性阅读。


实践项目建议

学完对应章节后,建议动手做这些项目:

完成章节 推荐项目 难度 关键技术点
第6-7章 个人AI助手(命令行版) 多轮对话、消息历史管理、流式输出
第11章 本地文档问答系统 ⭐⭐ 文档分块、向量检索、RAG流程
第12章 带工具调用的ReAct Agent ⭐⭐⭐ Function Calling、ReAct循环、工具错误处理
第13章 多步骤研究报告生成Agent ⭐⭐⭐ LangGraph状态机、Human-in-Loop、流式输出
第16章 微调一个领域专属模型 ⭐⭐⭐⭐ LoRA、数据集准备、效果评估
第18章 完整AI服务(含监控、流式输出) ⭐⭐⭐⭐ FastAPI、SSE、LangSmith、错误处理、Docker部署

Java背景特别适合的项目

  • 代码审查Agent:接入GitHub API,Java代码分析经验直接复用
    • 技术要点:Function Calling调用GitHub API、ReAct循环分析代码、结构化输出问题报告
  • Text-to-SQL助手:LLM生成SQL,Java数据库经验是优势
    • 技术要点:Prompt工程(SQL生成)、结构化输出、数据库连接、结果验证
  • 企业内部知识库:RAG + 权限控制,Java后端工程化能力大显身手
    • 技术要点:RAG系统、多租户权限控制、FastAPI服务、Docker部署

第一个项目:从第6-7章开始

很多初学者问:学到哪里可以开始做第一个项目?

答案是:学完第6-7章就可以开始

第一个项目推荐:命令行版个人AI助手(难度⭐)

你只需要会:

  • 调用Claude或OpenAI的API
  • 维护对话历史(让AI记得上下文)
  • 处理用户输入和AI输出

不需要会:RAG、Agent、LangChain……这些都是后面的事。

先把这个简单的项目做出来,跑起来,感受一下"我真的在用AI写程序"——这种感觉会让你更有动力继续学下去。


开始之前:自测你的基础

不需要AI背景,但需要会基础编程。用这个清单快速自测:

✅ 如果你能做到以下3件事,可以直接开始:

  • 能写一个Python函数(不需要很复杂,def add(a, b): return a + b 这种就行)
  • 知道什么是变量、列表、字典
  • 能用命令行运行 python hello.py

⚠️ 如果还不会,先补:

  • Python入门:推荐《Python编程:从入门到实践》前10章,或者廖雪峰Python教程
  • 预计1-2周,然后回来继续

❓ 关于数学:

  • 走路径A(Agent应用开发):完全不需要数学,跳过第3-5章
  • 走路径B(完整AI工程师):需要高中数学水平(函数、概率基础)

❓ 关于英语:

  • 代码里的英文都是常用词,不需要专门学英语
  • 遇到不认识的词,翻译软件就够了

快速开始(推荐初学者先做这一步)

第一次接触 AI 开发? 不要被下面的"环境准备"吓到——先看这个:

→ 15分钟快速入门:跑通你的第一个 AI 程序

这份文档会带你一步一步:验证环境 → 获取 DeepSeek API Key → 运行第一个程序 → 看到 AI 回复。
完成后再回来看下面的完整环境配置。


环境准备

# 安装 uv(推荐的 Python 包管理工具)
curl -LsSf https://astral.sh/uv/install.sh | sh

# 创建项目
uv init my-agent-project
cd my-agent-project

# 安装核心依赖
uv add openai langchain langgraph \
       python-dotenv pydantic chromadb

# 深度学习相关(路径B需要)
uv add torch torchvision scikit-learn pandas numpy matplotlib

需要准备的 API Key:

  • DeepSeek API(主要使用):在 https://platform.deepseek.com 注册获取
  • OpenAI API(部分章节使用,主要是 LangChain/LangGraph 相关章节)

关于代码示例中的 API 选择:代码示例主要使用 DeepSeek API(通过 OpenAI 兼容接口),DeepSeek 是国内主流大模型,性价比高且对中文支持好。部分章节(LangChain、LangGraph 等框架)使用 OpenAI API,原因是这些框架的官方文档以 OpenAI 为主,保持一致更容易对照学习。两套 API 的核心概念完全相同,切换只需要替换 client 初始化和 model 参数。


代码版本说明

课程代码基于以下主要包版本编写(2026 年 3 月):

版本
openai(DeepSeek/OpenAI 调用) ≥ 1.50
langchain ≥ 0.3
langgraph ≥ 0.2
pydantic ≥ 2.0
python ≥ 3.11

AI 框架迭代很快,遇到代码报错时:

  1. 先查对应框架的官方文档和 CHANGELOG
  2. 检查包版本是否符合上表要求(pip show langchain 查看当前版本)
  3. 课程配套代码仓库会持续更新,遇到版本问题可对照仓库代码

一点说明

AI 领域变化很快,框架的具体 API 会随版本更新变化。但本课程重点讲的核心概念——Token 机制、Prompt 设计原则、RAG 架构、Agent 设计模式——这些是稳定的,不会过时。

遇到代码报错,优先查对应框架的官方文档和 CHANGELOG,不要死磕。


课程持续更新。有问题或建议,欢迎评论区留言。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐