从0到1搭建Agentic AI智能客服：提示工程架构师的实战手册

Agent（智能体）：具备自主决策能力的AI系统，能感知环境、制定计划、执行行动；提示工程（Prompt Engineering）：通过设计精准的文本指令，引导LLM完成特定任务（比如“识别用户意图”“调用工具”）；ReAct框架：一种让Agent“思考（Reason）+行动（Act）”的提示模式，模拟人类解决问题的逻辑；工具调用（Tool Calling）：Agent通过API访问外部系统（如物

AI云原生与云计算技术学院

800人浏览 · 2026-01-11 20:33:29

AI云原生与云计算技术学院 · 2026-01-11 20:33:29 发布

从0到1搭建Agentic AI智能客服：提示工程架构师的实战手册

1. 引入：当客服从“机械响应”走向“自主思考”

1.1 一个让所有客服从业者头疼的场景

凌晨2点，电商客服后台弹出一条用户消息：

“我昨天买的XX品牌羽绒服（订单号12345）显示‘已签收’但我没收到，另外这件衣服的填充物是白鸭绒吗？还有我之前领的50元优惠券能不能叠加双11的满减？”

传统客服系统的反应是什么？

规则引擎：只能识别“查订单”“查商品参数”“查优惠券”三个独立意图，需要用户分三次提问；
普通LLM客服：能生成自然语言回答，但无法调用订单系统查真实物流状态，也不知道优惠券的实时规则（LLM训练数据截止到2023年10月）；
人工客服：需要同时查三个系统，还要组织语言整合信息，凌晨时段可能响应延迟。

而Agentic AI智能客服的反应是：

“您好，我先帮您核实订单状态——已调用物流系统查询，您的订单12345实际由快递柜代收（取件码：6789），请尽快取件～
另外，这款羽绒服的填充物是90%白鸭绒（已核对商品知识库）；您的50元优惠券可以叠加双11满200减30的活动（已调用优惠券系统验证）。
还有其他问题我可以帮您解答吗？”

1.2 为什么Agentic AI是客服的下一站？

Agentic AI（智能体AI）的核心是**“自主决策+工具调用+记忆迭代”**——它不是“更聪明的聊天机器人”，而是能像人类客服一样：

感知：听懂用户的复合需求（不是割裂的“查订单”“查商品”）；
思考：判断“先查物流还是先查优惠券”“需要调用哪些系统”；
行动：主动访问内部工具（物流API、知识库、优惠券系统）获取实时数据；
记忆：记住用户的历史偏好（比如上次用户问过同款衣服的尺码）。

对于企业而言，Agentic AI客服能解决三个核心痛点：

降低人力成本：处理80%的复合问题，让人工客服聚焦复杂投诉；
提升用户体验：无需用户重复输入信息，一次解决多个问题；
数据闭环：通过记忆模块积累用户画像，实现个性化服务。

1.3 本文的学习路径：从“知其然”到“知其所以然”

我们将按照**“基础认知→模块拆解→实战搭建→优化迭代”**的逻辑，帮你完成：

理解Agentic AI客服的核心框架；
掌握提示工程驱动各模块的设计技巧；
用LangChain+LLM实现一个可运行的Demo；
学会评估与优化系统的方法。

2. 概念地图：Agentic AI客服的“四梁八柱”

在动手搭建前，我们需要先建立整体认知框架——Agentic AI客服的核心是“感知-思考-行动-记忆”循环，每个环节都需要提示工程驱动，同时依赖工具生态的支持。

2.1 核心概念图谱

2.2 关键术语定义

Agent（智能体）：具备自主决策能力的AI系统，能感知环境、制定计划、执行行动；
提示工程（Prompt Engineering）：通过设计精准的文本指令，引导LLM完成特定任务（比如“识别用户意图”“调用工具”）；
ReAct框架：一种让Agent“思考（Reason）+行动（Act）”的提示模式，模拟人类解决问题的逻辑；
工具调用（Tool Calling）：Agent通过API访问外部系统（如物流、订单）获取实时数据的能力；
记忆模块（Memory）：分为短期（对话上下文）和长期（用户历史行为），用于保持对话连贯性和个性化。

3. 基础理解：用“餐厅服务员”类比Agentic客服

为了让抽象概念更直观，我们用**“智能餐厅服务员”**类比Agentic AI客服：

Agentic客服模块	餐厅服务员对应场景	核心目标
感知层	听清楚顾客说：“我要一份番茄炒蛋，不要糖，另外上次的优惠券能用吗？”	准确解析需求（菜品+忌口+优惠券）
决策层	思考：“先确认优惠券是否可用（问收银台），再告诉厨房不要放糖”	确定行动顺序和所需工具
行动层	去收银台查优惠券→告诉厨房忌口→给顾客下单	调用工具并执行
记忆层	记住顾客“不吃糖”的偏好，下次主动提醒	保存历史信息，优化后续服务

3.1 感知层：让Agent“听懂”用户的话

感知层的核心是**“从用户输入中提取有效信息”**，包括三个步骤：

3.1.1 意图识别：判断用户“要什么”

比如用户输入“我的快递没收到”，意图是“查询物流状态”；输入“衣服尺码小了”，意图是“申请换货”。

提示设计示例（针对LLM）：

“请分析用户输入的核心意图，可选意图包括：查订单、查物流、咨询商品、申请售后、查优惠券。
用户输入：‘我买的手机充不进电，想退货’
输出格式：{“intent”: “申请售后”, “sub_intent”: “退货”}”

3.1.2 实体提取：获取“关键信息”

比如“订单号12345”“手机型号iPhone15”“用户ID6789”——这些是调用工具的必要参数。

提示设计示例：

“请从用户输入中提取以下实体：订单号（order_id）、商品ID（product_id）、用户ID（user_id）。如果没有，请标为null。
用户输入：‘我的订单12345还没到’
输出格式：{“order_id”: “12345”, “product_id”: null, “user_id”: null}”

3.1.3 信息补全：问清“缺失的细节”

如果用户没提供关键信息（比如没说订单号），Agent需要主动询问：

提示设计示例：

“如果用户输入中没有订单号，请回复：‘请问您的订单号是什么？我可以帮您快速查询。’
如果没有商品ID，请回复：‘请问您咨询的商品ID是什么？我会为您核实详情。’”

3.2 决策层：让Agent“想清楚”该怎么做

决策层是Agentic客服的“大脑”，核心是**“用提示引导Agent按逻辑思考”。目前最常用的框架是ReAct（Reasoning + Acting）**——让Agent先“想”（分析需求），再“做”（调用工具）。

3.2.1 ReAct框架的提示模板

你现在需要解决用户的问题，按照以下步骤思考：
1. 回顾对话历史：用户之前问过什么？我之前回复了什么？
2. 分析当前需求：用户的核心问题是什么？需要哪些信息？
3. 判断是否需要调用工具：
   - 如果需要：要调用哪个工具？需要什么参数？
   - 如果不需要：直接生成回答。
4. 执行行动：按照指定格式调用工具，或回复用户。

用户问题：“我的订单12345还没到，另外优惠券能用吗？”
对话历史：用户之前没有提问。
思考过程：
- 用户有两个问题：查订单状态、查优惠券可用性。
- 查订单需要调用物流系统（工具：get_logistics_status，参数：order_id=12345）。
- 查优惠券需要调用优惠券系统（工具：check_coupon，参数：user_id=用户ID，coupon_id=用户提到的优惠券）。
- 用户没说优惠券ID，需要先问：“请问您的优惠券ID是什么？我帮您核实是否可用。”

3.3 行动层：让Agent“做得到”

行动层的核心是**“正确调用工具+整合结果生成回复”**，需要解决两个问题：

3.3.1 工具调用的格式规范

为了让LLM正确输出工具调用指令，需要定义严格的格式（比如JSON+分隔符）。以LangChain为例：

提示中的工具调用格式要求：

“如果需要调用工具，请用以下格式包裹：
<|FunctionCallBegin|>[{“name”:“工具名”,“parameters”:{“参数1”:“值1”,“参数2”:“值2”}}]<|FunctionCallEnd|>
例如：<|FunctionCallBegin|>[{“name”:“get_logistics_status”,“parameters”:{“order_id”:“12345”}}]<|FunctionCallEnd|>”

3.3.2 结果整合与响应生成

工具返回结果后，Agent需要将“机器语言”转化为“人类语言”。比如物流系统返回：

{"order_id": "12345", "status": "已签收", "location": "XX快递柜", "pickup_code": "6789"}

Agent需要生成自然语言回复：

“您的订单12345已由XX快递柜代收，取件码是6789，请尽快取件～”

3.4 记忆层：让Agent“记得住”

记忆层是Agentic客服“个性化”的关键，分为短期记忆（对话上下文）和长期记忆（用户画像）：

3.4.1 短期记忆：保持对话连贯性

比如用户先问“我的订单12345还没到”，然后问“它什么时候能到？”——Agent需要记住“它”指的是订单12345。

实现方式：用LangChain的ConversationBufferMemory保存最近5轮对话，提示中加入：

“请回顾对话历史，理解用户的指代（比如‘它’‘那个订单’）。”

3.4.2 长期记忆：积累用户偏好

比如用户上次买过“XX品牌羽绒服”，并提到“不吃糖”——Agent需要将这些信息存入向量数据库（如Pinecone），下次用户再问“推荐一件羽绒服”时，主动推荐该品牌。

提示设计示例：

“请更新用户画像：

历史购买：XX品牌羽绒服（订单号12345）；

偏好：不喜欢甜口菜品；

问题历史：咨询过羽绒服填充物。”

4. 层层深入：从Demo到生产的技术细节

4.1 第一步：选择Agent框架

目前主流的Agent框架有三个：LangChain、AutoGPT、LlamaIndex。我们选择LangChain——它的工具调用和记忆模块最成熟，适合快速搭建客服系统。

LangChain的核心组件：

LLMChain：连接LLM与提示；
Tool：定义工具的名称、参数、描述；
Agent：选择ReActAgent（支持思考+行动）；
Memory：ConversationBufferMemory（短期）+VectorStoreMemory（长期）。

4.2 第二步：搭建最小可行Demo（MVD）

我们以电商查订单场景为例，搭建一个能调用物流API的Agentic客服。

4.2.1 环境准备

安装依赖：pip install langchain openai python-dotenv；
配置OpenAI API密钥（.env文件）；

准备一个模拟的物流API（返回固定结果）：

def get_logistics_status(order_id: str) -> str:
    # 模拟物流系统返回
    if order_id == "12345":
        return "您的订单已由XX快递柜代收，取件码：6789"
    else:
        return "未找到该订单，请检查订单号是否正确"

4.2.2 定义工具

用LangChain的Tool类封装物流API：

from langchain.tools import Tool

tools = [
    Tool(
        name="get_logistics_status",
        func=get_logistics_status,
        description="用于查询订单的物流状态，需要传入order_id参数"
    )
]

4.2.3 设计提示模板

使用ReAct框架的提示：

from langchain.prompts import PromptTemplate

react_prompt = PromptTemplate(
    input_variables=["input", "history", "tools", "tool_names"],
    template="""你是一个电商客服，需要帮助用户解决问题。请按照以下步骤思考：
1. 回顾对话历史：{history}
2. 分析用户输入：{input}
3. 判断是否需要调用工具：
   - 如果需要：选择工具（可选工具：{tool_names}），并按格式调用；
   - 如果不需要：直接回复用户。

工具调用格式：<|FunctionCallBegin|>[{"name":"工具名","parameters":{"参数1":"值1"}}]<|FunctionCallEnd|>

请开始思考："""
)

4.2.4 初始化Agent

from langchain.agents import initialize_agent, AgentType
from langchain.memory import ConversationBufferMemory
from langchain.chat_models import ChatOpenAI

# 初始化LLM
llm = ChatOpenAI(model_name="gpt-3.5-turbo", temperature=0)

# 初始化记忆
memory = ConversationBufferMemory(memory_key="history", return_messages=True)

# 初始化Agent
agent = initialize_agent(
    tools,
    llm,
    agent=AgentType.CHAT_REACT_DESCRIPTION,
    verbose=True,
    memory=memory,
    prompt=react_prompt
)

4.2.5 测试Demo

运行以下代码，输入用户问题：

response = agent.run("我的订单12345还没到，能帮我查一下吗？")
print(response)

预期输出：

思考过程：用户想查询订单12345的物流状态，需要调用get_logistics_status工具，参数order_id=12345。
工具调用：<|FunctionCallBegin|>[{“name”:“get_logistics_status”,“parameters”:{“order_id”:“12345”}}]<|FunctionCallEnd|>
回复用户：您的订单已由XX快递柜代收，取件码：6789。

4.3 第三步：处理复杂场景——复合问题与错误

真实场景中，用户的问题往往是复合的（比如“查订单+查优惠券”），或者工具调用会失败（比如订单号不存在）。我们需要优化提示来处理这些情况。

4.3.1 处理复合问题

用户输入：“我的订单12345还没到，另外我之前的50元优惠券能用吗？”

优化后的决策层提示：

“如果用户有多个问题，请按优先级排序（先解决紧急的问题，比如查订单），逐一调用工具，最后整合结果回复。”

Agent的思考过程：

第一个问题：查订单状态→调用get_logistics_status；
第二个问题：查优惠券→调用check_coupon（需要用户提供优惠券ID）；
回复用户：先告知订单状态，再询问优惠券ID。

4.3.2 处理工具调用错误

如果用户输入错误的订单号（比如“12346”），物流API返回“未找到该订单”。

优化后的提示：

“如果工具返回错误或无效结果，请向用户说明情况，并引导他们补充正确信息。例如：‘未找到订单号12346，请检查是否输入正确？’”

4.4 第四步：底层逻辑——提示工程的设计原则

提示工程不是“写更长的提示”，而是**“精准引导Agent的思考逻辑”**。以下是四个核心原则：

4.4.1 明确性（Clarity）

不要模糊，要明确告诉Agent“做什么”“怎么做”。比如不要说“帮用户查订单”，要说“调用get_logistics_status工具，传入order_id参数”。

4.4.2 结构性（Structure）

用框架（如ReAct）让Agent的思考有步骤。比如“回顾历史→分析需求→判断工具→执行行动”。

4.4.3 适应性（Adaptability）

根据场景调整提示。比如投诉场景需要加入empathy：

“当用户投诉时，先表达歉意：‘很抱歉给您带来不便’，再解决问题。”

4.4.4 可验证性（Verifiability）

让Agent的思考过程可追溯。比如要求Agent输出“思考过程”，方便调试：

“请输出你的思考过程，然后再调用工具或回复用户。”

5. 多维透视：从历史、实践到未来

5.1 历史视角：客服系统的进化之路

阶段	技术	特点	痛点
1.0	规则引擎（IVR）	按按键选择服务（按1查订单）	无法处理复杂问题
2.0	统计学习（SVM/CRF）	能识别简单意图（比如“查物流”）	依赖标注数据，泛化能力差
3.0	LLM驱动（ChatGPT）	自然语言交互，能回答开放问题	无法调用实时工具，没有记忆
4.0	Agentic AI	自主决策+工具调用+记忆	需设计提示工程，可控性待提升

5.2 实践视角：电商场景的Agentic客服案例

某头部电商平台的Agentic客服上线3个月后，数据显示：

复合问题解决率从30%提升到85%；
人工客服接入率从60%下降到20%；
用户满意度（CSAT）从4.2分提升到4.8分（5分制）。

关键设计点：

感知层：用LLM+规则混合识别意图（比如“查订单”的准确率达99%）；
决策层：用ReAct框架处理复合问题（比如“查订单+查优惠券”）；
记忆层：用向量数据库保存用户的“尺码偏好”“常用地址”，推荐商品时更精准；
工具生态：整合了物流、订单、优惠券、知识库四个系统的API。

5.3 批判视角：Agentic客服的局限性

可控性风险：Agent可能“自作主张”（比如调用错误的工具），需要通过**“提示约束”和“权限控制”**解决（比如限制Agent调用支付系统的权限）；
隐私问题：处理用户的敏感信息（比如身份证号）时，需要加密存储和最小化权限（比如Agent只能获取订单号，不能获取身份证号）；
成本问题：维护工具生态和提示工程需要投入人力，适合有一定技术能力的企业。

5.4 未来视角：Agentic客服的进化方向

多模态交互：支持用户发图片（比如投诉商品损坏），Agent能识别图片内容并调用售后系统；
强化学习（RL）：让Agent从用户反馈中学习（比如用户说“回复太慢”，Agent会优化思考速度）；
群体智能：多个Agent协作解决复杂问题（比如“售后Agent”处理退货，“商品Agent”处理参数咨询）；
实时知识更新：用RAG（检索增强生成）让Agent访问最新的知识库（比如双11的活动规则）。

6. 实践转化：从Demo到生产的全流程

6.1 步骤1：需求分析——明确“做什么”

在动手搭建前，需要回答三个问题：

业务场景：电商、金融、教育？（不同场景的工具生态不同）；
核心功能：查订单、咨询商品、申请售后、下单？（优先做高频功能）；
用户痛点：传统客服的哪些问题最让用户不满？（比如“需要重复输入信息”“解决不了复合问题”）。

6.2 步骤2：工具生态建设——“连接”内部系统

Agentic客服的价值在于调用企业内部工具，因此需要：

梳理工具清单：列出需要调用的系统（物流、订单、优惠券、知识库）；
封装API：将每个系统的功能封装成LangChain的Tool类；
测试API稳定性：确保工具调用的成功率≥99%（否则Agent会频繁出错）。

6.3 步骤3：提示工程迭代——“调教”Agent

提示工程是一个迭代过程，需要根据用户反馈不断优化：

初始提示：用ReAct框架写出基础提示；
测试反馈：用真实用户的问题测试，记录Agent的错误（比如“没有问订单号”“调用错误的工具”）；
优化提示：针对错误调整提示（比如加入“如果用户没说订单号，要主动询问”）；
验证效果：重新测试，确保错误率下降。

6.4 步骤4：评估体系——“衡量”系统效果

需要从四个维度评估Agentic客服的效果：

6.4.1 准确性（Accuracy）

意图识别准确率：≥95%；
工具调用准确率：≥98%；
响应内容准确率：≥95%。

6.4.2 效率（Efficiency）

平均处理时间：≤10秒（比人工客服快2-3倍）；
用户输入次数：≤2次（无需重复输入信息）。

6.4.3 满意度（Satisfaction）

用户满意度（CSAT）：≥4.5分（5分制）；
净推荐值（NPS）：≥30%。

6.4.4 可控性（Controllability）

异常行为率：≤1%（比如调用错误的工具）；
人工介入率：≤20%（高频问题无需人工）。

6.5 步骤5：上线与优化——“迭代”系统

灰度上线：先让小部分用户使用（比如10%），收集反馈；
监控系统：用ELK（Elasticsearch+Logstash+Kibana）监控Agent的思考过程、工具调用、响应内容；
快速迭代：根据监控数据优化提示和工具（比如用户反馈“回复太慢”，就优化思考步骤，减少工具调用次数）。

7. 整合提升：从“搭建”到“精通”

7.1 核心观点回顾

Agentic AI客服的核心是**“感知-思考-行动-记忆”**循环；
提示工程是驱动循环的关键，要遵循明确性、结构性、适应性、可验证性原则；
工具生态和记忆模块是“个性化”和“实时性”的基础；
评估与迭代是系统从Demo到生产的必经之路。

7.2 知识体系重构

请用以下问题梳理自己的知识体系：

我的业务场景需要哪些工具？（物流、订单、知识库？）
每个模块的提示该怎么设计？（感知层→意图识别，决策层→ReAct框架）
如何处理复杂场景？（复合问题、工具错误）
如何评估系统效果？（准确性、效率、满意度）

7.3 拓展任务：教育场景的Agentic客服

尝试为教育机构设计Agentic客服，解决以下问题：

用户输入：“我的课程《Python入门》怎么还没开通？另外作业截止时间是什么时候？”

要求：

感知层：识别意图为“查课程开通状态+查作业截止时间”；
决策层：调用课程系统（get_course_status）和作业系统（get_homework_deadline）；
行动层：整合结果回复用户；
记忆层：保存用户的“课程历史”（比如用户之前学过《Java入门》）。

7.4 学习资源推荐

框架文档：LangChain官方文档（https://python.langchain.com/）；
论文：ReAct（https://arxiv.org/abs/2210.03629）、Agentic AI（https://arxiv.org/abs/2308.08155）；
博客：OpenAI博客（https://openai.com/blog/）、Hugging Face博客（https://huggingface.co/blog/）；
课程：Coursera《LangChain for LLM Application Development》。

结语：Agentic AI客服的本质是“用AI模拟优秀客服”

优秀的人类客服能听懂需求、理清逻辑、调用资源、记住偏好——Agentic AI客服的目标就是用技术复现这个过程。而提示工程架构师的任务，就是用精准的指令，让AI学会“像优秀客服一样思考”。

从0到1搭建Agentic AI客服，不是“堆砌技术”，而是“理解业务+设计逻辑+迭代优化”的过程。希望这篇手册能帮你迈出第一步，最终打造出真正能解决用户问题的智能客服系统。

下一个阶段，让我们一起探索Agentic AI的群体智能——多个Agent协作解决更复杂的问题！

（完）

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

03-后端AI服务：FastAPI部署机器学习模型

本文介绍了如何使用FastAPI高效部署机器学习模型。FastAPI凭借其高性能、开发便捷性和完善的生态系统，成为AI后端服务的理想选择。文章详细展示了图像分类模型的实际部署过程，包括模型加载、数据模型定义和API接口实现。通过ResNet50模型示例，演示了如何构建一个完整的图像识别API服务，涵盖图像预处理、预测结果格式化等关键环节。该方案支持异步处理、请求验证和自动文档生成，为生产环境中的A