大语言模型实战（五）——大模型开发范式演进：从“调用API”到“多Agent复杂目标”

大模型的普及不仅带来了能力的升级，也重构了开发思路——从“写代码实现功能”到“用模型能力落地业务目标”。本文结合实际案例，拆解大模型开发范式的四层演进逻辑，帮你理清不同场景下的技术选择。

小陈phd

450人浏览 · 2025-12-22 17:43:56

小陈phd · 2025-12-22 17:43:56 发布

大模型开发范式演进：从“调用API”到“多Agent复杂目标”

1. 基础层：面向对象开发（大模型原生API调用）

1.1 核心逻辑

把大模型当作一个“对象”，直接调用其原生API（如OpenAI的ChatCompletion），通过Prompt+API参数实现基础交互。

1.2 案例：对话机器人

from openai import OpenAI
import os

# 初始化大模型对象
client = OpenAI(api_key=os.getenv("OPENAI_API_KEY"))

# 1. 构建Prompt（对象的“输入参数”）
messages = [
    {"role": "system", "content": "你是一个乐于助人的智能AI小助手"},
    {"role": "user", "content": "你好，请你介绍一下你自己"}
]

# 2. 调用模型API（对象的“方法”）
completion = client.chat.completions.create(
    model="gpt-3.5-turbo",
    messages=messages
)

# 3. 解析结果（对象的“返回值”）
print(completion.choices[0].message.content)

1.3 特点

开发成本极低：无需复杂逻辑，仅需调用API；
能力局限：只能实现简单交互，无法处理复杂任务；
适用场景：快速验证需求、基础问答/生成类功能。

2. 进阶层：面向过程开发（Chain/RAG）

2.1核心逻辑

以**“流程步骤”为核心**，将大模型能力与工具/知识库结合，按“步骤串联”的方式实现复杂任务。

2.2 典型范式

2.2.1. Chain（流程链）

把任务拆分为多个步骤，让大模型按顺序执行：

示例：“用户问题→判别问题类型→调用对应模型（数学/语文/其他）→返回结果”

2.2.2. RAG（检索增强生成）

解决大模型“不懂专属知识”的问题，流程为：

把业务文档拆分为片段并向量化，存入向量数据库；
用户提问时，先检索知识库中相关片段；
将“检索结果+用户问题”传给大模型，生成基于专属知识的答案（如开头的RAG示意图）。

2.3 代表工具

LangChain（流程链）、LlamaIndex（RAG）、Milvus（向量数据库）。

2.4 特点

能力扩展：可接入工具、知识库，突破大模型原生限制；
开发复杂度中等：需设计流程步骤、对接外部组件；
适用场景：企业知识库问答、多步骤任务（如“查天气→推荐穿搭”）。

3. 升级层：面向目标开发（单Agent）

3.1 核心逻辑

以**“业务目标”为核心**，让大模型（Agent）自主规划任务步骤、调用工具，最终完成目标——从“人写流程”升级为“模型自己想流程”。

3.2 案例：智能差旅

用户目标：“我要去北京西站接朋友”
Agent的自主流程：

规划任务：拆解为“打车→订饭店→订酒店”；
执行任务：自动调用对应的工具API（滴滴API订车、大众点评API订饭店/酒店）；
完成目标：整合结果，给用户提供完整方案。

3.3 核心能力

任务规划：将复杂目标拆分为可执行的子任务；
工具调用：自主选择并调用合适的工具；
结果整合：将工具返回的结果整理为最终答案。

3.4 特点

自主性强：模型自主决策，无需人工写死流程；
适配复杂目标：能处理需要多工具、多步骤的业务场景；
适用场景：智能助理、自动化办公、复杂业务流程（如“客户接待全流程”）。

4. 顶层：面向复杂目标开发（多Agent）

4.1 核心逻辑

当目标足够复杂时，用多个Agent分工协作：每个Agent负责一个细分领域，由“ supervisor（监管Agent）”分配任务、协调结果，最终完成复杂目标。

4.2 案例：低代码开发平台

Supervisor：接收用户需求，判断需要哪些Agent协作；
Agent 1：负责前端页面设计；
Agent 2：负责后端接口开发；
Agent 3：负责数据库配置；
结果整合：Supervisor汇总各Agent的输出，生成最终的低代码项目。

4.3 核心价值

分工协作：不同Agent专注不同领域，提升任务精度；
处理超复杂目标：单个Agent无法完成的任务，通过多Agent协作实现；
适用场景：复杂项目开发、跨领域咨询（如“医疗+法律的联合咨询”）、企业级自动化系统。

5. 大模型开发范式的演进金字塔

5.1 开发金字塔层级

从“简单调用”到“复杂协作”，大模型开发范式的演进呈现清晰的层级：

          面向复杂目标开发（多Agent）
                ↓
          面向目标开发（单Agent）
                ↓
          面向过程开发（Chain/RAG）
                ↓
          面向对象开发（大模型原生API）

5.2 选择建议

简单需求：用“面向对象”（直接调用API）；
需工具/知识库：用“面向过程”（Chain/RAG）；
需自主完成业务目标：用“面向目标”（单Agent）；
超复杂、跨领域目标：用“面向复杂目标”（多Agent）。

6. Agent的设计理念——如何让大模型拥有“自主能力”

在大模型开发的“面向目标/复杂目标”范式中，Agent的核心是“让模型具备类人的自主决策能力”。而这种能力的实现，依赖于一套完整的“认知架构”——这正是Agent设计理念的核心。

6.1. 核心：大模型（LLM）——Agent的“大脑”

大模型是Agent的决策中心，负责处理所有信息、生成指令，相当于人类的“大脑”。

作用：接收输入（用户需求、工具反馈、记忆信息），通过推理生成“下一步做什么”的决策。
核心能力：理解自然语言、逻辑推理、任务规划、工具调用判断。

6.2. Tools（工具集）——Agent的“手脚”

Tools是Agent与外部世界交互的接口，相当于人类的“手脚”，让Agent能完成“大脑做不到的事”。

常见工具：
- 信息类：Search（搜索引擎，获取实时数据）；
- 计算类：Calculator（计算器）、CodeInterpreter（代码解释器，处理复杂计算/绘图）；
- 日程类：Calendar（日历，管理时间）；
- 业务类：CRM接口、订单系统API等。
作用：执行大模型的指令，将结果返回给大模型，供其后续决策。

6.3. Memory（记忆系统）——Agent的“记忆”

Memory让Agent能“记住信息”，避免“做过就忘”，分为两类：

Short-term memory（短期记忆）：存储当前任务的上下文信息（如用户的多轮对话内容、工具的最近反馈）；
- 作用：保证任务的连续性（比如用户说“帮我订明天的票”，Agent能记住“明天”是哪一天）。
Long-term memory（长期记忆）：存储长期沉淀的信息（如用户的偏好、历史任务的经验）；
- 作用：让Agent更“懂用户”（比如记住用户“喜欢靠窗的座位”）、更“聪明”（复用历史任务的成功经验）。
实现方式：短期记忆通常用“对话历史列表”存储；长期记忆常用向量数据库（如Chroma）存储，需要时检索。

6.4. Planning（规划）——Agent的“任务拆解能力”

Planning让Agent能将复杂目标拆分为可执行的子任务，相当于人类的“做计划”。

核心子能力：
- Subgoal decomposition（子目标拆解）：把“去北京接朋友”拆分为“打车→订饭店→订酒店”；
- Chain of thoughts（思维链）：让Agent“分步推理”（比如“先查北京的天气，再推荐穿搭”）。
作用：将模糊的目标转化为“一步一步能做的事”，保证任务可执行。

6.5. Reflection（反思）——Agent的“自我修正能力”

Reflection是Agent的“自我迭代机制”，相当于人类的“复盘、纠错”。

核心子能力：
- Self-criticism（自我批判）：Agent执行步骤后，会检查“这一步做对了吗？有没有更好的方法？”；
- 作用：避免错误的决策（比如订错了日期，Agent能自我发现并修正），提升任务的成功率。

6.6. Action（行动）——Agent的“执行闭环”

Action是Agent的“执行模块”，负责将大模型的决策转化为实际操作：

流程：大模型生成“调用某工具的指令”→ Action模块将指令转化为工具的API调用→ 获取工具返回结果→ 反馈给大模型，完成“决策→执行→反馈”的闭环。

6.7 Agent的工作流程：像人一样解决问题

以“帮用户订明天去北京西站的车票+推荐附近餐厅”为例，Agent的完整工作流程是：

接收需求：用户说“帮我订明天去北京西站的车票，再推荐附近的餐厅”；
短期记忆：记录“用户需要订明天的车票、推荐餐厅”；
Planning：拆解为子任务：“查明天去北京西站的车次→订合适的车票→查车站附近的餐厅→推荐餐厅”；
Action+Tools：
- 调用“车票查询工具”查车次；
- 调用“订票API”完成订票；
- 调用“地图工具”查车站附近的餐厅；
Memory：将“用户订了明天9点的车票、喜欢川菜”存入长期记忆；
Reflection：检查“车票日期是明天吗？餐厅离车站近吗？”，确认无误后整合结果；
输出结果：告诉用户“已订明天9点的车票，推荐车站附近的XX川菜馆”。

6.8 Agent设计的核心：“类人认知”

Agent的设计理念，本质是用技术模拟人类的认知流程：

大脑（大模型）→ 决策；
手脚（Tools）→ 执行；
记忆（Memory）→ 存储信息；
规划（Planning）→ 拆分任务；
反思（Reflection）→ 修正错误。

正是这套架构，让Agent能从“被动执行指令”升级为“主动解决问题”——这也是大模型从“工具”变成“助手”的关键。

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

9个AI论文工具，助力继续教育学员高效写作！

2048 AI社区

10个降AI率工具推荐，专科生高效避坑指南

2048 AI社区

AI编程的未来：程序员的角色转变

随着人工智能技术的飞速发展，AI在编程领域的应用越来越广泛。本文章的目的在于全面分析AI编程的未来走向，以及这种发展对程序员角色带来的转变。我们将探讨AI编程的核心概念、算法原理、实际应用场景等方面，同时关注程序员在这一变革过程中需要做出的调整和应对策略。范围涵盖了从基础的理论知识到实际的项目开发，旨在为程序员和相关从业者提供一个全面的视角，帮助他们更好地理解和适应未来的发展。本文将按照以下结构进