从0到1学习AI Agent智能体——学习路径

行者无疆_ty

289人浏览 · 2026-02-27 19:58:41

行者无疆_ty · 2026-02-27 19:58:41 发布

AI Agent智能体学习路径

本文聚焦AI Agent的10个核心模块，每个模块明确「核心内容、学习重点、线上学习资源」，兼顾理论理解与工程落地，适配面试备考与日常学习。后续将按每个模块发布详细的学习内容。

10个核心模块汇总表

模块序号	模块名称	核心定位	学习重点
1	Prompt工程	LLM驱动Agent的核心基础，决定Agent决策与交互效果	核心范式（ReAct、CoT）、Prompt设计与优化、场景适配
2	Agent 基础	岗位入门门槛，理解Agent架构与交互的基础	Agent定义与特征、类型划分、核心结构、环境交互逻辑
3	Function Call 与 Skills 与 MCP	Agent工具调用、能力扩展、多任务协同的核心	函数调用流程、技能封装、多上下文存储与融合
4	RAG（检索增强生成）	解决Agent幻觉，实现长期记忆与知识管理的核心技术	RAG完整流程、文本分割与向量存储、检索优化
5	LangChain框架	Agent开发主流框架，简化工程落地流程	核心组件使用、工具调用与记忆机制、工程落地实操
6	AutoGen框架	多Agent协同开发核心框架，适配复杂任务协作	核心组件配置、多Agent协作模式、工程落地实操
7	AI Coding	岗位工程基础能力，提升Agent开发效率	AI Coding工具使用、编码规范、Agent代码调试
8	本地部署	Agent工程落地加分项，实现离线运行与隐私保护	环境搭建、模型与组件本地部署、性能优化
9	模型蒸馏	Agent性能优化方向，实现轻量化部署	蒸馏原理与步骤、Agent场景适配、工具使用
10	模型微调	Agent个性化优化核心，提升场景适配性	LoRA等微调类型、关键步骤、Agent场景适配

模块1：Prompt工程

一、核心内容

Prompt工程是通过设计精准、高效的提示词，引导大语言模型（LLM）输出符合预期的结果，是LLM驱动Agent的核心基础。核心涵盖Prompt设计原则、常用范式、优化方法，以及不同场景下的Prompt适配技巧，直接影响Agent的决策准确性与交互自然度。

二、学习重点

核心原则：清晰性、具体性、引导性，避免模糊表述，明确任务目标；
常用范式：ReAct（思考-行动-观察）、CoT（思维链）、Few-Shot（少样本提示）、Zero-Shot（零样本提示），重点掌握前两种（Agent推理核心）；
优化技巧：指令优化、上下文控制、错误修正、角色设定，解决模型幻觉、输出偏离问题；
场景适配：结合Agent对话、工具调用、决策推理等场景，设计针对性Prompt。

三、线上学习资源

官方文档：OpenAI Prompt Engineering Guide（最权威，含示例与最佳实践）；
线上课程：DeepLearning.AI《ChatGPT Prompt Engineering for Developers》（免费，实操性强）；
视频教程：B站「Prompt工程从入门到精通」（通俗易懂，含Agent场景案例）；
论文：《Chain-of-Thought Prompting Elicits Reasoning in Large Language Models》《ReAct: Synergizing Reasoning and Acting in Language Models》。

模块2：Agent 基础

一、核心内容

Agent基础是AI Agent岗位的入门门槛，核心涵盖Agent的定义、核心特征、类型划分、核心结构，以及Agent与环境、LLM的交互逻辑，是理解后续架构设计、组件抽象的基础。

二、学习重点

核心定义与特征：明确Agent是“自主感知、决策、执行，与环境交互实现目标的智能实体”，掌握自主性、反应性、社会性、目标导向性四大特征；
类型划分：重点区分简单反射型、基于模型的反射型、目标导向型、学习型Agent，掌握各自适用场景；
核心结构：感知模块、决策模块、执行模块、状态存储模块，关联后续Tool/Memory/Context组件；
交互逻辑：Agent与环境的“感知-决策-执行-反馈”循环，LLM作为Agent“大脑”的核心作用。

三、线上学习资源

书籍：《人工智能：一种现代方法》（第4版）第2章（Agent基础经典教材）；
线上课程：Coursera《人工智能导论》（斯坦福大学）Agent章节；
视频教程：B站「AI Agent入门详解」（梳理核心概念，贴合岗位需求）；
文档：LangChain官方文档「Agent基础」章节（结合工程落地场景）。

模块3：Function Call 与 Skills 与 MCP

一、核心内容

三者是Agent实现工具调用、能力扩展、多任务协同的核心，Function Call（函数调用）是Agent与外部工具交互的桥梁，Skills（技能）是Agent可执行的具体能力封装，MCP（Multi-Context Processing，多上下文处理）是Agent处理复杂任务、多来源信息的核心机制。

二、学习重点

Function Call：掌握函数定义、参数校验、调用流程（识别需求→选择函数→调用→解析结果），以及异常处理（超时、失败重试）；
Skills：掌握技能封装逻辑，将常用能力（如查询、计算、生成）封装为可复用技能，实现Agent能力扩展；
MCP：掌握多上下文的存储、检索、融合方法，解决上下文过载、多任务冲突问题，适配多Agent协同场景。

三、线上学习资源

官方文档：OpenAI Function Call 官方指南、LangChain Tool/Function章节；
实操教程：GitHub「Function Call实战案例」（含Agent工具调用完整代码）；
视频教程：B站「AI Agent函数调用从入门到实战」（含技能封装示例）；
论文：《Toolformer: Language Models Can Teach Themselves to Use Tools》。

模块4：RAG（检索增强生成）

一、核心内容

RAG是解决Agent“幻觉”、提升决策准确性的核心技术，通过将外部知识库（文档、数据）检索与LLM生成结合，让Agent基于真实、最新的信息进行决策，是Agent长期记忆、知识管理的核心实现方式。

二、学习重点

核心流程：文档加载→文本分割→向量嵌入→向量存储→检索匹配→上下文融合→生成输出；
关键技术：文本分割策略（避免语义断裂）、向量嵌入模型选择、向量数据库使用（Pinecone、Chroma）；
优化方向：检索准确性优化、上下文融合技巧、知识库更新机制，适配Agent长期记忆场景；
工程落地：结合LangChain实现RAG流程，集成到Agent系统中。

三、线上学习资源

官方文档：LangChain RAG官方指南、Pinecone/Chroma官方文档（向量数据库使用）；
线上课程：DeepLearning.AI《Retrieval-Augmented Generation (RAG)》（免费，实操性强）；
实操教程：GitHub「LangChain RAG实战项目」（含完整代码与知识库搭建）；
视频教程：B站「RAG检索增强生成完整教程」（从理论到落地）。

模块5：LangChain框架

一、核心内容

LangChain是AI Agent开发的主流框架，核心用于简化Agent的开发流程，提供Prompt管理、工具调用、记忆机制、链（Chain）与Agent封装等功能，支持快速搭建通用型、工具型Agent，是工程落地的核心工具。

二、学习重点

核心组件：Agent类（ZeroShotAgent、ConversationalAgent）、Tool类、Memory类、Chain类，掌握各组件的作用与使用方法；
核心功能：Prompt模板管理、工具调用封装、记忆机制（短期/长期）、RAG集成、多Agent简单协同；
工程落地：使用LangChain搭建简单Agent、工具调用型Agent，掌握组件间解耦设计；
进阶技巧：自定义Tool、自定义Memory，结合向量数据库实现长期记忆，优化Agent性能。

三、线上学习资源

官方文档：LangChain官方文档（中文/英文，最权威，含示例代码）；
线上课程：LangChain官方实战教程、B站「LangChain从入门到精通」；
书籍：《LangChain实战：构建大语言模型驱动的应用》；
开源项目：LangChain官方示例项目（agent-tools、rag示例）。

模块6：AutoGen框架

一、核心内容

AutoGen是聚焦多Agent协同的主流框架，核心优势在于灵活的角色定义、多模态通信、动态任务调度，支持快速搭建多Agent协同系统，适配复杂任务拆解与协作，是多Agent架构设计的核心工具。

二、学习重点

核心组件：Agent类、GroupChat（多Agent聊天）、AssistantAgent、UserProxyAgent，掌握各组件的角色与配置方法；
多Agent协作：主从模式、平权协商模式的实现，任务分配、通信协议、冲突仲裁逻辑；
工程落地：使用AutoGen搭建多Agent协同系统（如对话Agent+工具Agent），实现任务协同；
与LangChain对比：掌握两者的架构差异、适用场景，能根据需求选型。

三、线上学习资源

官方文档：AutoGen官方文档（含快速入门、示例代码）；
实操教程：AutoGen官方Demo（多Agent协同案例）、GitHub「AutoGen实战项目」；
视频教程：B站「AutoGen多Agent协同开发教程」；
论文：《AutoGen: Enabling Next-Generation LLM Applications via Multi-Agent Conversation》。