【收藏版】吃透 ReAct 范式：大模型 Agent 从 “不可控” 到 “可落地” 的核心方法论

ReAct = Reasoning（推理）+ Acting（行动），本质是一种让大模型通过与外部工具、环境动态交互完成复杂任务的智能体架构范式。其核心目标是打破传统LLM“输入-输出”的单向链路，构建“感知-决策-执行-反馈”的智能闭环，让模型从被动的“问答机器”升级为主动的“问题解决者”。显式推理轨迹。

EnjoyEDU

1432人浏览 · 2026-02-08 10:15:00

EnjoyEDU · 2026-02-08 10:15:00 发布

近一年来，大模型Agent相关方案呈爆发式增长，从日常工作的自动化流程、研发阶段的开发辅助，到企业级复杂任务编排，Agent几乎成为所有AI应用落地的标配形态。

但在实际落地过程中，不少开发者都会遇到一个共性痛点：随着任务流程的复杂化，模型的执行行为越来越不可预测，一旦任务失败，故障原因也难以精准定位，这成为制约Agent大规模落地的关键瓶颈。

要破解这一问题，需要从Agent的底层执行逻辑入手——多数Agent系统并非让模型“一劳永逸”地完成任务，而是通过多轮推理、行动执行和环境反馈的循环来推进流程。而ReAct范式正是对这一核心执行过程的抽象与标准化，它为Agent搭建了一套清晰、可控的工作链路，让复杂任务能够以结构化的方式逐步落地。

本文将从原理、架构、实战三个维度拆解ReAct，结合可直接运行的代码示例，带你掌握这一让大模型Agent“可控、可解释、可扩展”的核心范式。

在人工智能的发展进程中，大语言模型（LLM）凭借强大的文本生成能力惊艳业界，但“黑箱”特性也带来了诸多现实问题：模型常生成看似合理却与事实不符的“幻觉”内容，推理过程无迹可寻，且无法与外部环境交互获取实时信息——比如让模型查询2024年最新的行业政策，它可能仍沿用预训练数据中的旧信息作答。

2022年，普林斯顿大学与谷歌联合发布的《ReAct: Synergizing Reasoning and Acting in Language Models》论文，首次提出ReAct范式，通过构建“推理-行动-观察”（TAO）的闭环机制，实现了语言模型推理能力与外部环境交互能力的深度融合，为解决上述痛点提供了里程碑式的方案。ReAct（Reasoning+Acting）将模型的思考过程外显化、工具使用标准化，打造出可解释、可验证、可扩展的智能体架构，也是当前新手入门大模型Agent开发最值得掌握的核心方法论。

1 、什么是ReAct？（新手必懂核心定义）

ReAct = Reasoning（推理）+ Acting（行动），本质是一种让大模型通过与外部工具、环境动态交互完成复杂任务的智能体架构范式。其核心目标是打破传统LLM“输入-输出”的单向链路，构建“感知-决策-执行-反馈”的智能闭环，让模型从被动的“问答机器”升级为主动的“问题解决者”。

相较于传统AI技术，ReAct具备三个新手也能快速理解的核心特征：

显式推理轨迹：模型每一步行动前都会生成可追溯的“思考过程”（Thought），明确说明“为什么要做这个操作”，彻底解决了传统模型“黑箱决策”的可解释性问题——比如查询航班前，模型会清晰说明“当前需要获取明天深圳到海南晚上的航班信息，因此调用航班查询工具”；
外部环境锚定：通过调用搜索、计算、数据库查询等外部工具（Act）获取客观反馈（Observe），把推理过程绑定到真实数据上，从根源上减少“幻觉”——比如不会凭记忆回答“2024年诺贝尔物理学奖得主”，而是先调用搜索工具获取权威结果；
少量样本泛化：依托LLM的上下文学习能力，仅需1-5个包含“推理-行动-观察”的完整示例，就能快速适配多场景任务，无需大规模微调，大幅降低新手的开发成本。

从技术本质来看，ReAct并非单一算法，而是“语言模型+工具集+循环调度机制”的集成架构。它的核心创新在于复刻了人类解决问题的认知模式（分析问题→动手操作→根据结果调整），让AI具备了自主拆解任务、动态调整策略的能力——这也是新手入门Agent开发最易上手、最易落地的架构思路。

2 、核心思想与设计理念（从原理到落地）

2.1 核心思想：模拟人类认知的TAO闭环

ReAct的核心逻辑源于人类解决复杂问题的日常习惯：比如规划跨城旅行时，我们会先分析需求（推理），再查机票、订酒店（行动），最后根据航班余票、酒店价格调整计划（观察），形成循环。ReAct将这一过程抽象为“Thought（推理）→Act（行动）→Observe（观察）”的TAO闭环，每个环节的核心作用对新手来说可简单理解为：

Thought（推理）：模型的“内心思考”，用来分析任务目标、历史操作结果和当前状态，明确下一步该做什么、为什么这么做；
Act（行动）：模型与外部交互的“实际操作”，比如调用搜索引擎查信息、用计算器算数据、调用API订机票；
Observe（观察）：外部环境对行动的“客观反馈”，比如搜索结果、计算答案、预订成功/失败的提示，为下一轮推理提供真实依据。

这一闭环让ReAct摆脱了对模型预训练知识库的依赖，能处理超出训练数据范畴的实时、专业任务——比如让新手开发的Agent查询“最新的新能源汽车补贴政策”，模型会主动调用搜索工具获取当下的政策，而非依赖旧数据。

2.2 四大设计理念：新手落地不踩坑的核心原则

ReAct能落地的关键在于四大设计理念，新手掌握这些原则，能大幅降低Agent开发的试错成本：

环境锚定原则：强制模型处理事实性问题时优先调用外部工具，禁止“凭记忆作答”。比如核查“2024年诺贝尔物理学奖得主”，模型必须先搜权威信息，而非直接输出答案；
可解释性优先原则：推理轨迹必须包含“当前缺什么信息→调用什么工具→预期得到什么结果”，确保人类能看懂模型的决策逻辑。比如推理需明确“当前缺少明天深圳到海南晚上的航班信息，调用flight_search工具，参数为深圳、海南、明天、晚上，预期获取符合条件的航班列表”；
模块解耦原则：把推理逻辑、行动执行、循环调度拆成独立模块，用标准化接口通信。新手只需替换工具集，就能从“航班查询Agent”快速改成“酒店预订Agent”，无需重构核心代码；
容错性设计原则：通过异常捕获、行动重试、上下文裁剪处理工具调用失败、参数错误等问题。比如搜索工具超时后，模型会自动推理“搜索失败，尝试更换关键词重新搜索”，提升系统稳定性。

3、ReAct工作原理（新手可复刻的执行流程）

ReAct的工作流程分为“初始化-循环迭代-终止输出”三个阶段，新手按这个流程复刻，就能搭建基础的Agent框架：

3.1 初始化阶段：做好准备工作

为TAO循环打基础，核心操作对新手来说简单易懂：

任务解析：明确用户需求的核心——比如“查询明天从深圳到海南的航班，选最便宜、晚上的那班并预订”，先拆解出“查航班、筛价格、订机票”三个子任务；
示例加载：输入1-3个完整的“任务-推理-行动-观察-结果”示例，帮模型理解格式和逻辑（新手可直接复用本文示例）；
上下文初始化：创建一个“记录本”，用来存后续每一轮的TAO操作，方便模型参考历史状态。

3.2 循环迭代阶段：TAO闭环的核心执行

这是ReAct的核心，每轮都按“推理→行动→观察”的顺序来，新手重点关注步骤的连贯性：

步骤1：Thought（推理）：模型结合任务目标和历史记录，生成思考内容，明确下一步操作的依据。比如：“当前要查明天深圳到海南晚上的航班，还没获取任何数据，需调用flight_search工具，参数是深圳、海南、明天、晚上，先拿到航班列表再筛选最便宜的。”
步骤2：Act（行动）：把推理结果转换成标准化指令，格式必须固定（比如“工具名[参数1,参数2]”），新手需注意参数不能漏、格式不能错。比如调用航班查询工具的指令是“flight_search[深圳,海南,明天,晚上]”。
步骤3：Observe（观察）：校验行动指令格式，没问题就调用工具，返回结构化结果；格式错了就提示异常。比如航班查询的结果是：“符合条件航班列表：1. HU7089（深圳宝安→海口美兰，20:15-21:45，票价480元）；2. CZ6753（深圳宝安→三亚凤凰，21:30-23:05，票价620元）”。

每轮结束后，把TAO内容记到“记录本”里，若内容太长，就保留最近3轮+早期关键信息摘要，避免超出模型上下文窗口。

3.3 终止输出阶段：完成任务并反馈

满足以下任一条件就停止循环，输出结果：

正常终止：模型输出finish行动（比如“finish[明天深圳到海南最便宜晚上航班为HU7089，已完成预订]”）；
超时终止：达到预设最大迭代步数（新手建议设5-10步，按任务复杂度调整）；
异常终止：连续3次行动失败（比如工具调用超时），触发熔断机制。

终止后，整理历史TAO轨迹，输出“最终结果+执行链路”，让用户能看到模型“做了什么、为什么这么做”。

4、 ReAct技术架构（新手易理解的三层结构）

ReAct采用“核心逻辑层-执行循环层-外部交互层”的三层模块化架构，新手按层开发，能快速上手：

4.1 核心逻辑层：Agent的“决策大脑”

由“LLM+提示工程模块”构成，是模型做决策的核心，新手重点关注提示词的设计：

推理引擎：依赖GPT-4、Claude 3等LLM的上下文理解能力，生成连贯的推理轨迹；
行动规划器：通过提示词约束，把推理结果转换成标准化行动指令；
提示优化模块：新手可把LLM温度参数设为0.2-0.3（降低随机性），加入负面示例（比如“避免重复调用同一工具”），提升输出质量。

这一层无需微调LLM，新手只需写好提示词，就能激活模型的推理和行动规划能力。

4.2 执行循环层：Agent的“中枢调度”

负责串联TAO三个环节，新手可直接复用本文的ContextManager类和循环逻辑：

上下文管理器：存储、裁剪、提取历史TAO轨迹，确保上下文精简且有关键信息；
行动解析器：校验指令格式、提取参数、路由到对应工具；
循环调度器：控制迭代节奏，判断是否终止循环。

4.3 外部交互层：Agent的“手脚与五官”

是模型和外部环境交互的接口，新手核心要做“工具封装”：

工具集：按功能分类（信息检索、数据处理、服务预订等），每个工具实现统一的run()方法，新手可参考本文的FlightSearchTool、FlightBookTool封装自己的工具；
交互环境：分为虚拟环境（如文本游戏）和物理环境（如机器人控制）；
数据接口：把模型的指令参数转换成工具能识别的格式，再把工具结果转回模型能理解的内容。

5、ReAct解决了什么问题？（新手落地的核心价值）

ReAct针对性解决了传统AI的四大痛点，也是新手选择它做Agent开发的核心原因：

5.1 破解“事实幻觉”：让答案有依据

传统LLM靠内部知识作答，易产生幻觉；ReAct通过“调用工具→获取事实→整合答案”，把推理锚定到真实数据。实验显示，Fever事实核查任务中，ReAct的幻觉率仅8.2%，远低于纯思维链（CoT）的23.5%。

5.2 破解“策略僵化”：快速适配新场景

传统AI需大量训练才能适配新任务；ReAct依托LLM的推理能力，仅需2个示例就能在文本游戏ALFWorld中实现71%的任务成功率，远超强化学习模型的37%，新手无需大量训练数据就能落地。

5.3 破解“决策不可解释”：让模型“说清楚”

传统模型决策是“黑箱”，ReAct要求生成显式推理轨迹，每一步行动都有依据——比如银行理财咨询中，模型会明确“用户风险承受能力中等→推荐稳健型产品→调用知识库确认收益率”，新手也能看懂模型的决策逻辑。

5.4 破解“适配成本高”：模块化快速改

传统AI适配新场景需重构代码；ReAct只需替换外部工具集，比如从“航班查询”切换到“智能日程规划”，仅需把航班工具换成日历、地图工具，新手几小时就能完成适配。

6、代码示例（新手可直接运行的极简ReAct框架）

以下基于Python实现极简版ReAct框架，聚焦“工具封装”和“TAO循环调度”，新手复制即可运行，核心模块解析如下：

6.1 工具封装：标准化接口设计（新手易复用）

from typing import Any, List

class BaseTool:
    """工具基类：新手开发新工具时，直接继承这个类即可"""
    def __init__(self, name: str, description: str):
        self.name = name  # 工具名称（用于模型识别）
        self.description = description  # 工具描述（帮模型理解功能）

    def run(self, params: Any) -> str:
        """核心执行方法：子类必须实现，返回结构化结果"""
        raise NotImplementedError("新手提示：所有工具子类都要实现run方法！")

# 航班查询工具（新手可替换为自己的业务工具，如天气查询、酒店预订）
class FlightSearchTool(BaseTool):
    def __init__(self):
        super().__init__(
            name="flight_search",
            description="查询指定条件的航班信息，参数格式：出发地,目的地,日期,时段（上午/下午/晚上）"
        )

    def run(self, params: str) -> str:
        """模拟航班查询，新手可替换为真实航班API调用"""
        try:
            dep, arr, date, time_period = params.split(',')
            # 模拟数据，新手可替换为真实接口返回结果
            flight_map = {
                "深圳,海南,明天,晚上": "符合条件航班：1. HU7089（20:15-21:45，480元）；2. CZ6753（21:30-23:05，620元）"
            }
            return flight_map.get(f"{dep},{arr},{date},{time_period}", f"未找到{dep}到{arr}{date}{time_period}的航班")
        except Exception as e:
            return f"查询失败：{str(e)[:50]}"

# 航班预订工具（新手可参考封装其他服务类工具）
class FlightBookTool(BaseTool):
    def __init__(self):
        super().__init__(
            name="flight_book",
            description="预订指定航班，参数格式：航班号,乘客姓名,身份证号"
        )

    def run(self, params: str) -> str:
        """模拟航班预订，新手可替换为真实预订API"""
        try:
            flight_no, name, id_card = params.split(',')
            return f"预订成功！航班{flight_no}，乘客{name}（身份证尾号{id_card[-4:]}），请提前2小时到机场"
        except Exception as e:
            return f"预订失败：{str(e)[:50]}"

新手代码解析：BaseTool类定义了标准化接口，新手开发新工具（如酒店查询、天气查询）时，只需继承该类并实现run方法，无需改核心逻辑，降低开发难度。

6.2 TAO循环调度：核心流程控制（新手可直接运行）

class ContextManager:
    """上下文管理器：新手无需修改，直接复用即可"""
    def __init__(self, max_length: int = 4000):
        self.max_length = max_length  # 上下文最大字符数
        self.tao_trajectory = []  # 存储每轮TAO记录

    def add_tao(self, thought: str, action: str, observation: str) -> None:
        """添加TAO记录并裁剪超长内容"""
        self.tao_trajectory.append({"thought": thought, "action": action, "observation": observation})
        self._prune_trajectory()

    def _prune_trajectory(self) -> None:
        """裁剪逻辑：保留最近3轮+早期摘要，新手可按需调整"""
        trajectory_str = str(self.tao_trajectory)
        if len(trajectory_str) <= self.max_length:
            return
        recent = self.tao_trajectory[-3:] if len(self.tao_trajectory)>=3 else self.tao_trajectory
        early_summary = f"早期操作：{[item['action'][:10] for item in self.tao_trajectory[:-3]][:2]}..."
        self.tao_trajectory = [{"thought": "【早期摘要】", "action": "", "observation": early_summary}] + recent

    def get_context_str(self) -> str:
        """生成模型能理解的上下文，新手无需修改"""
        if not self.tao_trajectory:
            return "无历史操作"
        return "\n".join([f"步骤{idx+1}：思维：{item['thought']} | 行动：{item['action']} | 观察：{item['observation']}" 
                          for idx, item in enumerate(self.tao_trajectory)])

def react_core_loop(task: str, tools: List[BaseTool], max_steps: int = 6) -> tuple[str, str]:
    """ReAct核心循环：新手可直接调用，只需传入任务和工具列表"""
    # 初始化组件
    context_manager = ContextManager()
    tool_map = {tool.name: tool for tool in tools}

    # 提示词模板：新手可根据自己的任务修改示例和规则
    prompt_template = """
你是ReAct智能体，按"思维→行动→观察"循环完成任务，规则如下：
1. 思维：分析任务和历史操作，说明下一步行动的原因；
2. 行动：仅用提供的工具，格式为"工具名[参数]"，支持工具：{tool_descriptions}；
3. 观察：根据工具反馈调整策略，不凭记忆作答。

示例：
任务：查询昨天深圳到广州最便宜上午的航班
历史轨迹：无历史操作
思维：需要获取昨天深圳到广州上午的航班信息，调用flight_search工具，参数为"深圳,广州,昨天,上午"
行动：flight_search[深圳,广州,昨天,上午]
观察：符合条件航班：1. CZ3201（08:30-09:10，230元）；2. HU7125（09:40-10:20，280元）
思维：已获取航班列表，最便宜的是CZ3201，调用flight_book工具预订
行动：flight_book[CZ3201,张三,123456199001011234]
观察：预订成功：航班CZ3201，乘客张三（身份证尾号1234）

当前任务：{task}
历史轨迹：{context}
请输出当前步骤的思维和行动（仅输出思维和行动）：
思维：
行动：
    """

    # 循环执行TAO闭环
    for step in range(max_steps):
        # 1. 构建提示词
        tool_descriptions = "\n".join([f"- {name}：{tool.description}" for name, tool in tool_map.items()])
        prompt = prompt_template.format(tool_descriptions=tool_descriptions, task=task, context=context_manager.get_context_str()).strip()
        
        # 2. 模拟LLM输出（新手替换为OpenAI/Claude API调用即可）
        if step == 0:
            llm_output = """思维：当前要查明天深圳到海南晚上最便宜的航班并预订，还没获取数据，先调用flight_search工具，参数是深圳,海南,明天,晚上
行动：flight_search[深圳,海南,明天,晚上]"""
        elif step == 1:
            llm_output = """思维：已拿到航班列表，最便宜的是HU7089（480元），调用flight_book工具预订，参数为HU7089,李四,123456199505056789
行动：flight_book[HU7089,李四,123456199505056789]"""
        elif step == 2:
            llm_output = """思维：已完成航班查询和预订，观察结果显示预订成功，任务完成，提交结果
行动：finish[明天深圳到海南最便宜的晚上航班是HU7089（20:15-21:45，480元），已为李四完成预订]"""
        else:
            llm_output = """思维：任务已完成，无需继续操作
行动：finish[任务完成]"""

        # 3. 解析思维和行动
        thought = llm_output.split("思维：")[1].split("行动：")[0].strip()
        action = llm_output.split("行动：")[1].strip()

        # 4. 执行行动并获取观察结果
        if action.startswith("finish["):
            result = action[len("finish["):-1].strip()
            return result, context_manager.get_context_str()
        elif action.startswith(tuple(tool_map.keys())):
            tool_name = next(name for name in tool_map.keys() if action.startswith(name))
            param_str = action[len(tool_name)+1:-1].strip()
            observation = tool_map[tool_name].run(param_str)
        else:
            observation = f"无效行动：{action}，支持的工具：{list(tool_map.keys())}"

        # 5. 更新上下文
        context_manager.add_tao(thought, action, observation)
        print(f"步骤{step+1}：思维：{thought} | 行动：{action} | 观察：{observation}")

    # 超时终止
    return f"任务未完成（已达最大步数{max_steps}）", context_manager.get_context_str()

# 新手调用示例：直接运行即可看到效果
if __name__ == "__main__":
    # 初始化工具
    tools = [FlightSearchTool(), FlightBookTool()]
    # 定义任务
    task = "查询明天从深圳到海南的航班，选最便宜、航班时间在晚上的那班并预订"
    # 运行ReAct循环
    final_result, trajectory = react_core_loop(task, tools)
    # 输出结果
    print("\n最终结果：", final_result)
    print("\n完整执行轨迹：", trajectory)

新手代码解析：

ContextManager类负责存储和裁剪TAO记录，新手无需修改，直接复用；
react_core_loop函数是核心调度逻辑，新手只需替换“模拟LLM输出”部分为真实的OpenAI/Claude API调用，就能对接真实大模型；
示例任务聚焦“航班查询+预订”，新手可替换工具类（如换成酒店、天气工具），快速适配自己的业务场景。

7 、ReAct的应用场景（新手易落地的方向）

ReAct的模块化架构让它适配性极强，新手可从以下低门槛场景入手落地：

7.1 知识密集型任务：事实核查/多跳问答

比如“查询2024年新能源汽车补贴政策”“验证某学术论文的结论”，新手只需封装搜索引擎、知识库API工具，就能快速实现。

7.2 交互式决策任务：智能规划/电商购物

比如“规划北京3日游路线”“筛选并购买性价比最高的手机”，新手封装地图、电商平台API工具，就能让Agent自主完成“查路线→订酒店→对比商品”。

7.3 智能客服/咨询：理财/售后

比如“银行理财推荐”“电商售后问题处理”，新手封装用户信息库、客服知识库工具，让Agent先澄清用户需求，再调用工具给出个性化解答。

7.4 具身智能：简易机器人控制

比如“让桌面机器人抓取水杯”，新手封装机器人运动API、摄像头工具，让Agent通过“感知水杯位置→规划抓取路径→执行抓取”完成任务。

08 ReAct的优势对比（新手选对技术路线）

新手入门Agent开发，可通过下表清晰对比ReAct与其他主流方法的差异，选对最易落地的路线：

对比维度	ReAct	传统思维链（CoT）	Toolformer	强化学习（RL）
核心能力	推理+行动协同，自主决策	纯推理，无外部交互	工具调用，推理弱	行动优化，无显式推理
幻觉抑制	强（锚定外部事实）	弱（依赖内部知识）	中（工具调用但推理不足）	中（环境反馈无校验）
可解释性	强（显式推理+行动依据）	中（仅推理链）	弱（仅工具记录）	弱（黑箱策略）
场景适配性	强（模块化换工具）	弱（仅纯推理任务）	中（仅工具类任务）	弱（单场景定制训练）
落地成本	低（Few-shot适配，无微调）	低（无需工具）	中（需工具适配+微调）	高（大规模训练）

最后

对于正在迷茫择业、想转行提升，或是刚入门的程序员、编程小白来说，有一个问题几乎人人都在问：未来10年，什么领域的职业发展潜力最大？

答案只有一个：人工智能（尤其是大模型方向）

当下，人工智能行业正处于爆发式增长期，其中大模型相关岗位更是供不应求，薪资待遇直接拉满——字节跳动作为AI领域的头部玩家，给硕士毕业的优质AI人才（含大模型相关方向）开出的月基础工资高达5万—6万元；即便是非“人才计划”的普通应聘者，月基础工资也能稳定在4万元左右。

再看阿里、腾讯两大互联网大厂，非“人才计划”的AI相关岗位应聘者，月基础工资也约有3万元，远超其他行业同资历岗位的薪资水平，对于程序员、小白来说，无疑是绝佳的转型和提升赛道。

对于想入局大模型、抢占未来10年行业红利的程序员和小白来说，现在正是最好的学习时机：行业缺口大、大厂需求旺、薪资天花板高，只要找准学习方向，稳步提升技能，就能轻松摆脱“低薪困境”，抓住AI时代的职业机遇。

如果你还不知道从何开始，我自己整理一套全网最全最细的大模型零基础教程，我也是一路自学走过来的，很清楚小白前期学习的痛楚，你要是没有方向还没有好的资源，根本学不到东西！

下面是我整理的大模型学习资源，希望能帮到你。

👇👇扫码免费领取全部内容👇👇

在这里插入图片描述

最后

1、大模型学习路线

2、从0到进阶大模型学习视频教程

从入门到进阶这里都有，跟着老师学习事半功倍。

在这里插入图片描述

3、入门必看大模型学习书籍&文档.pdf（书面上的技术书籍确实太多了，这些是我精选出来的，还有很多不在图里）

在这里插入图片描述

4、 AI大模型最新行业报告

2026最新行业报告，针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估，以了解哪些行业更适合引入大模型的技术和应用，以及在哪些方面可以发挥大模型的优势。

5、面试试题/经验

【大厂 AI 岗位面经分享（107 道）】

【AI 大模型面试真题（102 道）】

【LLMs 面试真题（97 道）】

6、大模型项目实战&配套源码

适用人群

在这里插入图片描述

四阶段学习规划（共90天，可落地执行）

第一阶段（10天）：初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识，对大模型 AI 的理解超过 95% 的人，可以在相关讨论时发表高级、不跟风、又接地气的见解，别人只会和 AI 聊天，而你能调教 AI，并能用代码将大模型和业务衔接。

大模型 AI 能干什么？
大模型是怎样获得「智能」的？
用好 AI 的核心心法
大模型应用业务架构
大模型应用技术架构
代码示例：向 GPT-3.5 灌入新知识
提示工程的意义和核心思想
Prompt 典型构成
指令调优方法论
思维链和思维树
Prompt 攻击和防范
…

第二阶段（30天）：高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习，学会构造私有知识库，扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架，抓住最新的技术进展，适合 Python 和 JavaScript 程序员。

为什么要做 RAG
搭建一个简单的 ChatPDF
检索的基础概念
什么是向量表示（Embeddings）
向量数据库与向量检索
基于向量检索的 RAG
搭建 RAG 系统的扩展知识
混合检索与 RAG-Fusion 简介
向量模型本地部署
…

第三阶段（30天）：模型训练

恭喜你，如果学到这里，你基本可以找到一份大模型 AI相关的工作，自己也能训练 GPT 了！通过微调，训练自己的垂直大模型，能独立训练开源多模态大模型，掌握更多技术方案。

到此为止，大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗？

为什么要做 RAG
什么是模型
什么是模型训练
求解器 & 损失函数简介
小实验2：手写一个简单的神经网络并训练它
什么是训练/预训练/微调/轻量化微调
Transformer结构简介
轻量化微调
实验数据集的构建
…

第四阶段（20天）：商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知，可以在云端和本地等多种环境下部署大模型，找到适合自己的项目/创业方向，做一名被 AI 武装的产品经理。

硬件选型
带你了解全球大模型
使用国产大模型服务
搭建 OpenAI 代理
热身：基于阿里云 PAI 部署 Stable Diffusion
在本地计算机运行大模型
大模型的私有化部署
基于 vLLM 部署大模型
案例：如何优雅地在阿里云私有部署开源大模型
部署一套开源 LLM 项目
内容安全
互联网信息服务算法备案
…

👇👇扫码免费领取全部内容👇👇

3、这些资料真的有用吗？

这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理，现任上海殷泊信息科技CEO，其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证，服务航天科工、国家电网等1000+企业，以第一作者在IEEE Transactions发表论文50+篇，获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目，无论你是小白还是有些技术基础的技术人员，这份资料都绝对能帮助你提升薪资待遇，转行大模型岗位。
在这里插入图片描述