大语言模型实战(五)——大模型开发范式演进:从“调用API”到“多Agent复杂目标”
大模型的普及不仅带来了能力的升级,也重构了开发思路——从“写代码实现功能”到“用模型能力落地业务目标”。本文结合实际案例,拆解大模型开发范式的四层演进逻辑,帮你理清不同场景下的技术选择。
大模型开发范式演进:从“调用API”到“多Agent复杂目标”
大模型的普及不仅带来了能力的升级,也重构了开发思路——从“写代码实现功能”到“用模型能力落地业务目标”。本文结合实际案例,拆解大模型开发范式的四层演进逻辑,帮你理清不同场景下的技术选择。
1. 基础层:面向对象开发(大模型原生API调用)
1.1 核心逻辑
把大模型当作一个“对象”,直接调用其原生API(如OpenAI的ChatCompletion),通过Prompt+API参数实现基础交互。
1.2 案例:对话机器人
from openai import OpenAI
import os
# 初始化大模型对象
client = OpenAI(api_key=os.getenv("OPENAI_API_KEY"))
# 1. 构建Prompt(对象的“输入参数”)
messages = [
{"role": "system", "content": "你是一个乐于助人的智能AI小助手"},
{"role": "user", "content": "你好,请你介绍一下你自己"}
]
# 2. 调用模型API(对象的“方法”)
completion = client.chat.completions.create(
model="gpt-3.5-turbo",
messages=messages
)
# 3. 解析结果(对象的“返回值”)
print(completion.choices[0].message.content)
1.3 特点
- 开发成本极低:无需复杂逻辑,仅需调用API;
- 能力局限:只能实现简单交互,无法处理复杂任务;
- 适用场景:快速验证需求、基础问答/生成类功能。
2. 进阶层:面向过程开发(Chain/RAG)
2.1核心逻辑
以**“流程步骤”为核心**,将大模型能力与工具/知识库结合,按“步骤串联”的方式实现复杂任务。
2.2 典型范式
2.2.1. Chain(流程链)
把任务拆分为多个步骤,让大模型按顺序执行:
- 示例:“用户问题→判别问题类型→调用对应模型(数学/语文/其他)→返回结果”

2.2.2. RAG(检索增强生成)
解决大模型“不懂专属知识”的问题,流程为:
- 把业务文档拆分为片段并向量化,存入向量数据库;
- 用户提问时,先检索知识库中相关片段;
- 将“检索结果+用户问题”传给大模型,生成基于专属知识的答案(如开头的RAG示意图)。

2.3 代表工具
LangChain(流程链)、LlamaIndex(RAG)、Milvus(向量数据库)。
2.4 特点
- 能力扩展:可接入工具、知识库,突破大模型原生限制;
- 开发复杂度中等:需设计流程步骤、对接外部组件;
- 适用场景:企业知识库问答、多步骤任务(如“查天气→推荐穿搭”)。
3. 升级层:面向目标开发(单Agent)
3.1 核心逻辑
以**“业务目标”为核心**,让大模型(Agent)自主规划任务步骤、调用工具,最终完成目标——从“人写流程”升级为“模型自己想流程”。
3.2 案例:智能差旅

用户目标:“我要去北京西站接朋友”
Agent的自主流程:
- 规划任务:拆解为“打车→订饭店→订酒店”;
- 执行任务:自动调用对应的工具API(滴滴API订车、大众点评API订饭店/酒店);
- 完成目标:整合结果,给用户提供完整方案。
3.3 核心能力
- 任务规划:将复杂目标拆分为可执行的子任务;
- 工具调用:自主选择并调用合适的工具;
- 结果整合:将工具返回的结果整理为最终答案。
3.4 特点
- 自主性强:模型自主决策,无需人工写死流程;
- 适配复杂目标:能处理需要多工具、多步骤的业务场景;
- 适用场景:智能助理、自动化办公、复杂业务流程(如“客户接待全流程”)。
4. 顶层:面向复杂目标开发(多Agent)
4.1 核心逻辑
当目标足够复杂时,用多个Agent分工协作:每个Agent负责一个细分领域,由“ supervisor(监管Agent)”分配任务、协调结果,最终完成复杂目标。
4.2 案例:低代码开发平台

- Supervisor:接收用户需求,判断需要哪些Agent协作;
- Agent 1:负责前端页面设计;
- Agent 2:负责后端接口开发;
- Agent 3:负责数据库配置;
- 结果整合:Supervisor汇总各Agent的输出,生成最终的低代码项目。
4.3 核心价值
- 分工协作:不同Agent专注不同领域,提升任务精度;
- 处理超复杂目标:单个Agent无法完成的任务,通过多Agent协作实现;
- 适用场景:复杂项目开发、跨领域咨询(如“医疗+法律的联合咨询”)、企业级自动化系统。
5. 大模型开发范式的演进金字塔
5.1 开发金字塔层级
从“简单调用”到“复杂协作”,大模型开发范式的演进呈现清晰的层级:
面向复杂目标开发(多Agent)
↓
面向目标开发(单Agent)
↓
面向过程开发(Chain/RAG)
↓
面向对象开发(大模型原生API)
5.2 选择建议
- 简单需求:用“面向对象”(直接调用API);
- 需工具/知识库:用“面向过程”(Chain/RAG);
- 需自主完成业务目标:用“面向目标”(单Agent);
- 超复杂、跨领域目标:用“面向复杂目标”(多Agent)。
6. Agent的设计理念——如何让大模型拥有“自主能力”
在大模型开发的“面向目标/复杂目标”范式中,Agent的核心是“让模型具备类人的自主决策能力”。而这种能力的实现,依赖于一套完整的“认知架构”——这正是Agent设计理念的核心。
6.1. 核心:大模型(LLM)——Agent的“大脑”
大模型是Agent的决策中心,负责处理所有信息、生成指令,相当于人类的“大脑”。
- 作用:接收输入(用户需求、工具反馈、记忆信息),通过推理生成“下一步做什么”的决策。
- 核心能力:理解自然语言、逻辑推理、任务规划、工具调用判断。
6.2. Tools(工具集)——Agent的“手脚”
Tools是Agent与外部世界交互的接口,相当于人类的“手脚”,让Agent能完成“大脑做不到的事”。
- 常见工具:
- 信息类:Search(搜索引擎,获取实时数据);
- 计算类:Calculator(计算器)、CodeInterpreter(代码解释器,处理复杂计算/绘图);
- 日程类:Calendar(日历,管理时间);
- 业务类:CRM接口、订单系统API等。
- 作用:执行大模型的指令,将结果返回给大模型,供其后续决策。
6.3. Memory(记忆系统)——Agent的“记忆”
Memory让Agent能“记住信息”,避免“做过就忘”,分为两类:
- Short-term memory(短期记忆):存储当前任务的上下文信息(如用户的多轮对话内容、工具的最近反馈);
- 作用:保证任务的连续性(比如用户说“帮我订明天的票”,Agent能记住“明天”是哪一天)。
- Long-term memory(长期记忆):存储长期沉淀的信息(如用户的偏好、历史任务的经验);
- 作用:让Agent更“懂用户”(比如记住用户“喜欢靠窗的座位”)、更“聪明”(复用历史任务的成功经验)。
- 实现方式:短期记忆通常用“对话历史列表”存储;长期记忆常用向量数据库(如Chroma)存储,需要时检索。
6.4. Planning(规划)——Agent的“任务拆解能力”
Planning让Agent能将复杂目标拆分为可执行的子任务,相当于人类的“做计划”。
- 核心子能力:
- Subgoal decomposition(子目标拆解):把“去北京接朋友”拆分为“打车→订饭店→订酒店”;
- Chain of thoughts(思维链):让Agent“分步推理”(比如“先查北京的天气,再推荐穿搭”)。
- 作用:将模糊的目标转化为“一步一步能做的事”,保证任务可执行。
6.5. Reflection(反思)——Agent的“自我修正能力”
Reflection是Agent的“自我迭代机制”,相当于人类的“复盘、纠错”。
- 核心子能力:
- Self-criticism(自我批判):Agent执行步骤后,会检查“这一步做对了吗?有没有更好的方法?”;
- 作用:避免错误的决策(比如订错了日期,Agent能自我发现并修正),提升任务的成功率。
6.6. Action(行动)——Agent的“执行闭环”
Action是Agent的“执行模块”,负责将大模型的决策转化为实际操作:
- 流程:大模型生成“调用某工具的指令”→ Action模块将指令转化为工具的API调用→ 获取工具返回结果→ 反馈给大模型,完成“决策→执行→反馈”的闭环。
6.7 Agent的工作流程:像人一样解决问题
以“帮用户订明天去北京西站的车票+推荐附近餐厅”为例,Agent的完整工作流程是:
- 接收需求:用户说“帮我订明天去北京西站的车票,再推荐附近的餐厅”;
- 短期记忆:记录“用户需要订明天的车票、推荐餐厅”;
- Planning:拆解为子任务:“查明天去北京西站的车次→订合适的车票→查车站附近的餐厅→推荐餐厅”;
- Action+Tools:
- 调用“车票查询工具”查车次;
- 调用“订票API”完成订票;
- 调用“地图工具”查车站附近的餐厅;
- Memory:将“用户订了明天9点的车票、喜欢川菜”存入长期记忆;
- Reflection:检查“车票日期是明天吗?餐厅离车站近吗?”,确认无误后整合结果;
- 输出结果:告诉用户“已订明天9点的车票,推荐车站附近的XX川菜馆”。
6.8 Agent设计的核心:“类人认知”
Agent的设计理念,本质是用技术模拟人类的认知流程:
- 大脑(大模型)→ 决策;
- 手脚(Tools)→ 执行;
- 记忆(Memory)→ 存储信息;
- 规划(Planning)→ 拆分任务;
- 反思(Reflection)→ 修正错误。
正是这套架构,让Agent能从“被动执行指令”升级为“主动解决问题”——这也是大模型从“工具”变成“助手”的关键。

更多推荐


所有评论(0)