【收藏版】吃透 ReAct 范式:大模型 Agent 从 “不可控” 到 “可落地” 的核心方法论
ReAct = Reasoning(推理)+ Acting(行动),本质是一种让大模型通过与外部工具、环境动态交互完成复杂任务的智能体架构范式。其核心目标是打破传统LLM“输入-输出”的单向链路,构建“感知-决策-执行-反馈”的智能闭环,让模型从被动的“问答机器”升级为主动的“问题解决者”。显式推理轨迹。
近一年来,大模型Agent相关方案呈爆发式增长,从日常工作的自动化流程、研发阶段的开发辅助,到企业级复杂任务编排,Agent几乎成为所有AI应用落地的标配形态。
但在实际落地过程中,不少开发者都会遇到一个共性痛点:随着任务流程的复杂化,模型的执行行为越来越不可预测,一旦任务失败,故障原因也难以精准定位,这成为制约Agent大规模落地的关键瓶颈。
要破解这一问题,需要从Agent的底层执行逻辑入手——多数Agent系统并非让模型“一劳永逸”地完成任务,而是通过多轮推理、行动执行和环境反馈的循环来推进流程。而ReAct范式正是对这一核心执行过程的抽象与标准化,它为Agent搭建了一套清晰、可控的工作链路,让复杂任务能够以结构化的方式逐步落地。
本文将从原理、架构、实战三个维度拆解ReAct,结合可直接运行的代码示例,带你掌握这一让大模型Agent“可控、可解释、可扩展”的核心范式。
在人工智能的发展进程中,大语言模型(LLM)凭借强大的文本生成能力惊艳业界,但“黑箱”特性也带来了诸多现实问题:模型常生成看似合理却与事实不符的“幻觉”内容,推理过程无迹可寻,且无法与外部环境交互获取实时信息——比如让模型查询2024年最新的行业政策,它可能仍沿用预训练数据中的旧信息作答。
2022年,普林斯顿大学与谷歌联合发布的《ReAct: Synergizing Reasoning and Acting in Language Models》论文,首次提出ReAct范式,通过构建“推理-行动-观察”(TAO)的闭环机制,实现了语言模型推理能力与外部环境交互能力的深度融合,为解决上述痛点提供了里程碑式的方案。ReAct(Reasoning+Acting)将模型的思考过程外显化、工具使用标准化,打造出可解释、可验证、可扩展的智能体架构,也是当前新手入门大模型Agent开发最值得掌握的核心方法论。
1 、什么是ReAct?(新手必懂核心定义)
ReAct = Reasoning(推理)+ Acting(行动),本质是一种让大模型通过与外部工具、环境动态交互完成复杂任务的智能体架构范式。其核心目标是打破传统LLM“输入-输出”的单向链路,构建“感知-决策-执行-反馈”的智能闭环,让模型从被动的“问答机器”升级为主动的“问题解决者”。

相较于传统AI技术,ReAct具备三个新手也能快速理解的核心特征:
- 显式推理轨迹:模型每一步行动前都会生成可追溯的“思考过程”(Thought),明确说明“为什么要做这个操作”,彻底解决了传统模型“黑箱决策”的可解释性问题——比如查询航班前,模型会清晰说明“当前需要获取明天深圳到海南晚上的航班信息,因此调用航班查询工具”;
- 外部环境锚定:通过调用搜索、计算、数据库查询等外部工具(Act)获取客观反馈(Observe),把推理过程绑定到真实数据上,从根源上减少“幻觉”——比如不会凭记忆回答“2024年诺贝尔物理学奖得主”,而是先调用搜索工具获取权威结果;
- 少量样本泛化:依托LLM的上下文学习能力,仅需1-5个包含“推理-行动-观察”的完整示例,就能快速适配多场景任务,无需大规模微调,大幅降低新手的开发成本。
从技术本质来看,ReAct并非单一算法,而是“语言模型+工具集+循环调度机制”的集成架构。它的核心创新在于复刻了人类解决问题的认知模式(分析问题→动手操作→根据结果调整),让AI具备了自主拆解任务、动态调整策略的能力——这也是新手入门Agent开发最易上手、最易落地的架构思路。
2 、核心思想与设计理念(从原理到落地)
2.1 核心思想:模拟人类认知的TAO闭环
ReAct的核心逻辑源于人类解决复杂问题的日常习惯:比如规划跨城旅行时,我们会先分析需求(推理),再查机票、订酒店(行动),最后根据航班余票、酒店价格调整计划(观察),形成循环。ReAct将这一过程抽象为“Thought(推理)→Act(行动)→Observe(观察)”的TAO闭环,每个环节的核心作用对新手来说可简单理解为:
- Thought(推理):模型的“内心思考”,用来分析任务目标、历史操作结果和当前状态,明确下一步该做什么、为什么这么做;
- Act(行动):模型与外部交互的“实际操作”,比如调用搜索引擎查信息、用计算器算数据、调用API订机票;
- Observe(观察):外部环境对行动的“客观反馈”,比如搜索结果、计算答案、预订成功/失败的提示,为下一轮推理提供真实依据。
这一闭环让ReAct摆脱了对模型预训练知识库的依赖,能处理超出训练数据范畴的实时、专业任务——比如让新手开发的Agent查询“最新的新能源汽车补贴政策”,模型会主动调用搜索工具获取当下的政策,而非依赖旧数据。

2.2 四大设计理念:新手落地不踩坑的核心原则
ReAct能落地的关键在于四大设计理念,新手掌握这些原则,能大幅降低Agent开发的试错成本:
- 环境锚定原则:强制模型处理事实性问题时优先调用外部工具,禁止“凭记忆作答”。比如核查“2024年诺贝尔物理学奖得主”,模型必须先搜权威信息,而非直接输出答案;
- 可解释性优先原则:推理轨迹必须包含“当前缺什么信息→调用什么工具→预期得到什么结果”,确保人类能看懂模型的决策逻辑。比如推理需明确“当前缺少明天深圳到海南晚上的航班信息,调用flight_search工具,参数为深圳、海南、明天、晚上,预期获取符合条件的航班列表”;
- 模块解耦原则:把推理逻辑、行动执行、循环调度拆成独立模块,用标准化接口通信。新手只需替换工具集,就能从“航班查询Agent”快速改成“酒店预订Agent”,无需重构核心代码;
- 容错性设计原则:通过异常捕获、行动重试、上下文裁剪处理工具调用失败、参数错误等问题。比如搜索工具超时后,模型会自动推理“搜索失败,尝试更换关键词重新搜索”,提升系统稳定性。
3、ReAct工作原理(新手可复刻的执行流程)
ReAct的工作流程分为“初始化-循环迭代-终止输出”三个阶段,新手按这个流程复刻,就能搭建基础的Agent框架:

3.1 初始化阶段:做好准备工作
为TAO循环打基础,核心操作对新手来说简单易懂:
- 任务解析:明确用户需求的核心——比如“查询明天从深圳到海南的航班,选最便宜、晚上的那班并预订”,先拆解出“查航班、筛价格、订机票”三个子任务;
- 示例加载:输入1-3个完整的“任务-推理-行动-观察-结果”示例,帮模型理解格式和逻辑(新手可直接复用本文示例);
- 上下文初始化:创建一个“记录本”,用来存后续每一轮的TAO操作,方便模型参考历史状态。
3.2 循环迭代阶段:TAO闭环的核心执行
这是ReAct的核心,每轮都按“推理→行动→观察”的顺序来,新手重点关注步骤的连贯性:
- 步骤1:Thought(推理):模型结合任务目标和历史记录,生成思考内容,明确下一步操作的依据。比如:“当前要查明天深圳到海南晚上的航班,还没获取任何数据,需调用flight_search工具,参数是深圳、海南、明天、晚上,先拿到航班列表再筛选最便宜的。”
- 步骤2:Act(行动):把推理结果转换成标准化指令,格式必须固定(比如“工具名[参数1,参数2]”),新手需注意参数不能漏、格式不能错。比如调用航班查询工具的指令是“flight_search[深圳,海南,明天,晚上]”。
- 步骤3:Observe(观察):校验行动指令格式,没问题就调用工具,返回结构化结果;格式错了就提示异常。比如航班查询的结果是:“符合条件航班列表:1. HU7089(深圳宝安→海口美兰,20:15-21:45,票价480元);2. CZ6753(深圳宝安→三亚凤凰,21:30-23:05,票价620元)”。
每轮结束后,把TAO内容记到“记录本”里,若内容太长,就保留最近3轮+早期关键信息摘要,避免超出模型上下文窗口。
3.3 终止输出阶段:完成任务并反馈
满足以下任一条件就停止循环,输出结果:
- 正常终止:模型输出finish行动(比如“finish[明天深圳到海南最便宜晚上航班为HU7089,已完成预订]”);
- 超时终止:达到预设最大迭代步数(新手建议设5-10步,按任务复杂度调整);
- 异常终止:连续3次行动失败(比如工具调用超时),触发熔断机制。
终止后,整理历史TAO轨迹,输出“最终结果+执行链路”,让用户能看到模型“做了什么、为什么这么做”。
4、 ReAct技术架构(新手易理解的三层结构)
ReAct采用“核心逻辑层-执行循环层-外部交互层”的三层模块化架构,新手按层开发,能快速上手:

4.1 核心逻辑层:Agent的“决策大脑”
由“LLM+提示工程模块”构成,是模型做决策的核心,新手重点关注提示词的设计:
- 推理引擎:依赖GPT-4、Claude 3等LLM的上下文理解能力,生成连贯的推理轨迹;
- 行动规划器:通过提示词约束,把推理结果转换成标准化行动指令;
- 提示优化模块:新手可把LLM温度参数设为0.2-0.3(降低随机性),加入负面示例(比如“避免重复调用同一工具”),提升输出质量。
这一层无需微调LLM,新手只需写好提示词,就能激活模型的推理和行动规划能力。
4.2 执行循环层:Agent的“中枢调度”
负责串联TAO三个环节,新手可直接复用本文的ContextManager类和循环逻辑:
- 上下文管理器:存储、裁剪、提取历史TAO轨迹,确保上下文精简且有关键信息;
- 行动解析器:校验指令格式、提取参数、路由到对应工具;
- 循环调度器:控制迭代节奏,判断是否终止循环。
4.3 外部交互层:Agent的“手脚与五官”
是模型和外部环境交互的接口,新手核心要做“工具封装”:
- 工具集:按功能分类(信息检索、数据处理、服务预订等),每个工具实现统一的run()方法,新手可参考本文的FlightSearchTool、FlightBookTool封装自己的工具;
- 交互环境:分为虚拟环境(如文本游戏)和物理环境(如机器人控制);
- 数据接口:把模型的指令参数转换成工具能识别的格式,再把工具结果转回模型能理解的内容。
5、ReAct解决了什么问题?(新手落地的核心价值)
ReAct针对性解决了传统AI的四大痛点,也是新手选择它做Agent开发的核心原因:

5.1 破解“事实幻觉”:让答案有依据
传统LLM靠内部知识作答,易产生幻觉;ReAct通过“调用工具→获取事实→整合答案”,把推理锚定到真实数据。实验显示,Fever事实核查任务中,ReAct的幻觉率仅8.2%,远低于纯思维链(CoT)的23.5%。
5.2 破解“策略僵化”:快速适配新场景
传统AI需大量训练才能适配新任务;ReAct依托LLM的推理能力,仅需2个示例就能在文本游戏ALFWorld中实现71%的任务成功率,远超强化学习模型的37%,新手无需大量训练数据就能落地。
5.3 破解“决策不可解释”:让模型“说清楚”
传统模型决策是“黑箱”,ReAct要求生成显式推理轨迹,每一步行动都有依据——比如银行理财咨询中,模型会明确“用户风险承受能力中等→推荐稳健型产品→调用知识库确认收益率”,新手也能看懂模型的决策逻辑。
5.4 破解“适配成本高”:模块化快速改
传统AI适配新场景需重构代码;ReAct只需替换外部工具集,比如从“航班查询”切换到“智能日程规划”,仅需把航班工具换成日历、地图工具,新手几小时就能完成适配。
6、 代码示例(新手可直接运行的极简ReAct框架)
以下基于Python实现极简版ReAct框架,聚焦“工具封装”和“TAO循环调度”,新手复制即可运行,核心模块解析如下:
6.1 工具封装:标准化接口设计(新手易复用)
from typing import Any, List
class BaseTool:
"""工具基类:新手开发新工具时,直接继承这个类即可"""
def __init__(self, name: str, description: str):
self.name = name # 工具名称(用于模型识别)
self.description = description # 工具描述(帮模型理解功能)
def run(self, params: Any) -> str:
"""核心执行方法:子类必须实现,返回结构化结果"""
raise NotImplementedError("新手提示:所有工具子类都要实现run方法!")
# 航班查询工具(新手可替换为自己的业务工具,如天气查询、酒店预订)
class FlightSearchTool(BaseTool):
def __init__(self):
super().__init__(
name="flight_search",
description="查询指定条件的航班信息,参数格式:出发地,目的地,日期,时段(上午/下午/晚上)"
)
def run(self, params: str) -> str:
"""模拟航班查询,新手可替换为真实航班API调用"""
try:
dep, arr, date, time_period = params.split(',')
# 模拟数据,新手可替换为真实接口返回结果
flight_map = {
"深圳,海南,明天,晚上": "符合条件航班:1. HU7089(20:15-21:45,480元);2. CZ6753(21:30-23:05,620元)"
}
return flight_map.get(f"{dep},{arr},{date},{time_period}", f"未找到{dep}到{arr}{date}{time_period}的航班")
except Exception as e:
return f"查询失败:{str(e)[:50]}"
# 航班预订工具(新手可参考封装其他服务类工具)
class FlightBookTool(BaseTool):
def __init__(self):
super().__init__(
name="flight_book",
description="预订指定航班,参数格式:航班号,乘客姓名,身份证号"
)
def run(self, params: str) -> str:
"""模拟航班预订,新手可替换为真实预订API"""
try:
flight_no, name, id_card = params.split(',')
return f"预订成功!航班{flight_no},乘客{name}(身份证尾号{id_card[-4:]}),请提前2小时到机场"
except Exception as e:
return f"预订失败:{str(e)[:50]}"
新手代码解析:BaseTool类定义了标准化接口,新手开发新工具(如酒店查询、天气查询)时,只需继承该类并实现run方法,无需改核心逻辑,降低开发难度。
6.2 TAO循环调度:核心流程控制(新手可直接运行)
class ContextManager:
"""上下文管理器:新手无需修改,直接复用即可"""
def __init__(self, max_length: int = 4000):
self.max_length = max_length # 上下文最大字符数
self.tao_trajectory = [] # 存储每轮TAO记录
def add_tao(self, thought: str, action: str, observation: str) -> None:
"""添加TAO记录并裁剪超长内容"""
self.tao_trajectory.append({"thought": thought, "action": action, "observation": observation})
self._prune_trajectory()
def _prune_trajectory(self) -> None:
"""裁剪逻辑:保留最近3轮+早期摘要,新手可按需调整"""
trajectory_str = str(self.tao_trajectory)
if len(trajectory_str) <= self.max_length:
return
recent = self.tao_trajectory[-3:] if len(self.tao_trajectory)>=3 else self.tao_trajectory
early_summary = f"早期操作:{[item['action'][:10] for item in self.tao_trajectory[:-3]][:2]}..."
self.tao_trajectory = [{"thought": "【早期摘要】", "action": "", "observation": early_summary}] + recent
def get_context_str(self) -> str:
"""生成模型能理解的上下文,新手无需修改"""
if not self.tao_trajectory:
return "无历史操作"
return "\n".join([f"步骤{idx+1}:思维:{item['thought']} | 行动:{item['action']} | 观察:{item['observation']}"
for idx, item in enumerate(self.tao_trajectory)])
def react_core_loop(task: str, tools: List[BaseTool], max_steps: int = 6) -> tuple[str, str]:
"""ReAct核心循环:新手可直接调用,只需传入任务和工具列表"""
# 初始化组件
context_manager = ContextManager()
tool_map = {tool.name: tool for tool in tools}
# 提示词模板:新手可根据自己的任务修改示例和规则
prompt_template = """
你是ReAct智能体,按"思维→行动→观察"循环完成任务,规则如下:
1. 思维:分析任务和历史操作,说明下一步行动的原因;
2. 行动:仅用提供的工具,格式为"工具名[参数]",支持工具:{tool_descriptions};
3. 观察:根据工具反馈调整策略,不凭记忆作答。
示例:
任务:查询昨天深圳到广州最便宜上午的航班
历史轨迹:无历史操作
思维:需要获取昨天深圳到广州上午的航班信息,调用flight_search工具,参数为"深圳,广州,昨天,上午"
行动:flight_search[深圳,广州,昨天,上午]
观察:符合条件航班:1. CZ3201(08:30-09:10,230元);2. HU7125(09:40-10:20,280元)
思维:已获取航班列表,最便宜的是CZ3201,调用flight_book工具预订
行动:flight_book[CZ3201,张三,123456199001011234]
观察:预订成功:航班CZ3201,乘客张三(身份证尾号1234)
当前任务:{task}
历史轨迹:{context}
请输出当前步骤的思维和行动(仅输出思维和行动):
思维:
行动:
"""
# 循环执行TAO闭环
for step in range(max_steps):
# 1. 构建提示词
tool_descriptions = "\n".join([f"- {name}:{tool.description}" for name, tool in tool_map.items()])
prompt = prompt_template.format(tool_descriptions=tool_descriptions, task=task, context=context_manager.get_context_str()).strip()
# 2. 模拟LLM输出(新手替换为OpenAI/Claude API调用即可)
if step == 0:
llm_output = """思维:当前要查明天深圳到海南晚上最便宜的航班并预订,还没获取数据,先调用flight_search工具,参数是深圳,海南,明天,晚上
行动:flight_search[深圳,海南,明天,晚上]"""
elif step == 1:
llm_output = """思维:已拿到航班列表,最便宜的是HU7089(480元),调用flight_book工具预订,参数为HU7089,李四,123456199505056789
行动:flight_book[HU7089,李四,123456199505056789]"""
elif step == 2:
llm_output = """思维:已完成航班查询和预订,观察结果显示预订成功,任务完成,提交结果
行动:finish[明天深圳到海南最便宜的晚上航班是HU7089(20:15-21:45,480元),已为李四完成预订]"""
else:
llm_output = """思维:任务已完成,无需继续操作
行动:finish[任务完成]"""
# 3. 解析思维和行动
thought = llm_output.split("思维:")[1].split("行动:")[0].strip()
action = llm_output.split("行动:")[1].strip()
# 4. 执行行动并获取观察结果
if action.startswith("finish["):
result = action[len("finish["):-1].strip()
return result, context_manager.get_context_str()
elif action.startswith(tuple(tool_map.keys())):
tool_name = next(name for name in tool_map.keys() if action.startswith(name))
param_str = action[len(tool_name)+1:-1].strip()
observation = tool_map[tool_name].run(param_str)
else:
observation = f"无效行动:{action},支持的工具:{list(tool_map.keys())}"
# 5. 更新上下文
context_manager.add_tao(thought, action, observation)
print(f"步骤{step+1}:思维:{thought} | 行动:{action} | 观察:{observation}")
# 超时终止
return f"任务未完成(已达最大步数{max_steps})", context_manager.get_context_str()
# 新手调用示例:直接运行即可看到效果
if __name__ == "__main__":
# 初始化工具
tools = [FlightSearchTool(), FlightBookTool()]
# 定义任务
task = "查询明天从深圳到海南的航班,选最便宜、航班时间在晚上的那班并预订"
# 运行ReAct循环
final_result, trajectory = react_core_loop(task, tools)
# 输出结果
print("\n最终结果:", final_result)
print("\n完整执行轨迹:", trajectory)
新手代码解析:
- ContextManager类负责存储和裁剪TAO记录,新手无需修改,直接复用;
- react_core_loop函数是核心调度逻辑,新手只需替换“模拟LLM输出”部分为真实的OpenAI/Claude API调用,就能对接真实大模型;
- 示例任务聚焦“航班查询+预订”,新手可替换工具类(如换成酒店、天气工具),快速适配自己的业务场景。
7 、ReAct的应用场景(新手易落地的方向)
ReAct的模块化架构让它适配性极强,新手可从以下低门槛场景入手落地:
7.1 知识密集型任务:事实核查/多跳问答
比如“查询2024年新能源汽车补贴政策”“验证某学术论文的结论”,新手只需封装搜索引擎、知识库API工具,就能快速实现。
7.2 交互式决策任务:智能规划/电商购物
比如“规划北京3日游路线”“筛选并购买性价比最高的手机”,新手封装地图、电商平台API工具,就能让Agent自主完成“查路线→订酒店→对比商品”。
7.3 智能客服/咨询:理财/售后
比如“银行理财推荐”“电商售后问题处理”,新手封装用户信息库、客服知识库工具,让Agent先澄清用户需求,再调用工具给出个性化解答。
7.4 具身智能:简易机器人控制
比如“让桌面机器人抓取水杯”,新手封装机器人运动API、摄像头工具,让Agent通过“感知水杯位置→规划抓取路径→执行抓取”完成任务。
08 ReAct的优势对比(新手选对技术路线)
新手入门Agent开发,可通过下表清晰对比ReAct与其他主流方法的差异,选对最易落地的路线:
| 对比维度 | ReAct | 传统思维链(CoT) | Toolformer | 强化学习(RL) |
|---|---|---|---|---|
| 核心能力 | 推理+行动协同,自主决策 | 纯推理,无外部交互 | 工具调用,推理弱 | 行动优化,无显式推理 |
| 幻觉抑制 | 强(锚定外部事实) | 弱(依赖内部知识) | 中(工具调用但推理不足) | 中(环境反馈无校验) |
| 可解释性 | 强(显式推理+行动依据) | 中(仅推理链) | 弱(仅工具记录) | 弱(黑箱策略) |
| 场景适配性 | 强(模块化换工具) | 弱(仅纯推理任务) | 中(仅工具类任务) | 弱(单场景定制训练) |
| 落地成本 | 低(Few-shot适配,无微调) | 低(无需工具) | 中(需工具适配+微调) | 高(大规模训练) |
最后
对于正在迷茫择业、想转行提升,或是刚入门的程序员、编程小白来说,有一个问题几乎人人都在问:未来10年,什么领域的职业发展潜力最大?
答案只有一个:人工智能(尤其是大模型方向)
当下,人工智能行业正处于爆发式增长期,其中大模型相关岗位更是供不应求,薪资待遇直接拉满——字节跳动作为AI领域的头部玩家,给硕士毕业的优质AI人才(含大模型相关方向)开出的月基础工资高达5万—6万元;即便是非“人才计划”的普通应聘者,月基础工资也能稳定在4万元左右。
再看阿里、腾讯两大互联网大厂,非“人才计划”的AI相关岗位应聘者,月基础工资也约有3万元,远超其他行业同资历岗位的薪资水平,对于程序员、小白来说,无疑是绝佳的转型和提升赛道。

对于想入局大模型、抢占未来10年行业红利的程序员和小白来说,现在正是最好的学习时机:行业缺口大、大厂需求旺、薪资天花板高,只要找准学习方向,稳步提升技能,就能轻松摆脱“低薪困境”,抓住AI时代的职业机遇。
如果你还不知道从何开始,我自己整理一套全网最全最细的大模型零基础教程,我也是一路自学走过来的,很清楚小白前期学习的痛楚,你要是没有方向还没有好的资源,根本学不到东西!
下面是我整理的大模型学习资源,希望能帮到你。

👇👇扫码免费领取全部内容👇👇

最后
1、大模型学习路线

2、从0到进阶大模型学习视频教程
从入门到进阶这里都有,跟着老师学习事半功倍。

3、 入门必看大模型学习书籍&文档.pdf(书面上的技术书籍确实太多了,这些是我精选出来的,还有很多不在图里)

4、 AI大模型最新行业报告
2026最新行业报告,针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

5、面试试题/经验

【大厂 AI 岗位面经分享(107 道)】

【AI 大模型面试真题(102 道)】

【LLMs 面试真题(97 道)】

6、大模型项目实战&配套源码

适用人群

四阶段学习规划(共90天,可落地执行)
第一阶段(10天):初阶应用
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
- 大模型 AI 能干什么?
- 大模型是怎样获得「智能」的?
- 用好 AI 的核心心法
- 大模型应用业务架构
- 大模型应用技术架构
- 代码示例:向 GPT-3.5 灌入新知识
- 提示工程的意义和核心思想
- Prompt 典型构成
- 指令调优方法论
- 思维链和思维树
- Prompt 攻击和防范
- …
第二阶段(30天):高阶应用
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
- 为什么要做 RAG
- 搭建一个简单的 ChatPDF
- 检索的基础概念
- 什么是向量表示(Embeddings)
- 向量数据库与向量检索
- 基于向量检索的 RAG
- 搭建 RAG 系统的扩展知识
- 混合检索与 RAG-Fusion 简介
- 向量模型本地部署
- …
第三阶段(30天):模型训练
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
- 为什么要做 RAG
- 什么是模型
- 什么是模型训练
- 求解器 & 损失函数简介
- 小实验2:手写一个简单的神经网络并训练它
- 什么是训练/预训练/微调/轻量化微调
- Transformer结构简介
- 轻量化微调
- 实验数据集的构建
- …
第四阶段(20天):商业闭环
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
-
硬件选型
-
带你了解全球大模型
-
使用国产大模型服务
-
搭建 OpenAI 代理
-
热身:基于阿里云 PAI 部署 Stable Diffusion
-
在本地计算机运行大模型
-
大模型的私有化部署
-
基于 vLLM 部署大模型
-
案例:如何优雅地在阿里云私有部署开源大模型
-
部署一套开源 LLM 项目
-
内容安全
-
互联网信息服务算法备案
-
…
👇👇扫码免费领取全部内容👇👇

3、这些资料真的有用吗?
这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。
资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

更多推荐



所有评论(0)