智能体的工作流

LLM综合“当前对话内容”和“检索到的医学知识”，进行推理分析。：智能体生成一个包含所有商品、总价、推荐理由的完整方案，通过自然语言与用户交互：“为您找到了8件商品，总价498元，包含XXX...，您看可以吗？：如果测试通过，智能体可以调用[部署脚本工具]（如通过SSH执行命令），将代码部署到开发服务器进行集成测试。：问诊结束后，智能体自动将结构化的信息填入电子病历系统的[SOAP模板]（主观、客

matlab_python22

655人浏览 · 2025-09-07 15:50:57

matlab_python22 · 2025-09-07 15:50:57 发布

每个工作流都遵循 “感知 -> 规划 -> 执行 -> 反馈” 的经典智能体循环。

目录

场景一：电商全能购物助手 (Super Shopping Agent)

详细工作流：

场景二：医疗AI医生助手 (AI Doctor's Assistant)

详细工作流：

场景三：软件开发AI程序员 (AI Programmer)

详细工作流：

场景一：电商全能购物助手 (Super Shopping Agent)

用户指令： “帮我为下周末的8人户外野餐准备所有必需品，预算500元左右。”

详细工作流：

图表

代码

下载

执行

感知
接收用户指令

规划
LLM分解任务

反馈
生成最终方案

搜索与比价

筛选与决策

加入购物车

寻求用户确认

工具: 商品搜索API

工具: 比价算法

工具: 购物车API

工具: 自然语言交互

工作流说明：

感知：智能体通过文本或语音接口接收用户指令。
规划：LLM大脑将模糊需求分解为可执行任务：
- a. 理解核心要素：场景=户外野餐，人数=8人，预算=500元，时间=下周末。
- b. 推断所需商品类别：一次性餐具、野餐垫、便携食物、饮料、零食、垃圾袋等。
- c. 制定执行计划：先搜索，再比价，然后组合方案，最后确认。
执行：
- 搜索与比价：智能体并行地调用多个[商品搜索API]和[比价API]，获取各类别商品的列表、价格、销量、评价。
- 筛选与决策：智能体根据预算和人数（8人）进行计算和分配（例如：餐具至少买8套，食物分量要足够）。它利用LLM的理解能力，筛选出性价比高、评价好的商品。
- 加入购物车：智能体调用[购物车API]，将选中的所有商品加入购物车。
- 寻求用户确认：智能体生成一个包含所有商品、总价、推荐理由的完整方案，通过自然语言与用户交互：“为您找到了8件商品，总价498元，包含XXX...，您看可以吗？”
反馈：
- 若用户说“可以”，智能体调用[下单API]完成支付。
- 若用户说“不要薯片，换成果冻”，则进入新一轮循环，执行“移除商品->搜索果冻->加入购物车->再次确认”的流程。
- 最终，将订单结果反馈给用户：“野餐套餐已下单成功！预计周六上午送达。”

场景二：医疗AI医生助手 (AI Doctor's Assistant)

场景： 医生在诊室与患者交流，智能体实时辅助。

详细工作流：

图表

代码

下载

执行

感知
实时语音转文本

规划
LLM理解医患对话

反馈
生成结构化病历

实时摘要与提取

医学知识检索

诊断建议推理

工具: 医学实体识别NER

工具: 医学知识库RAG

工具: 诊断指南API

工作流说明：

感知：智能体通过麦克风实时收取医患对话，并通过[语音识别(ASR)API]将其转为文本流。
规划：LLM大脑持续监控对话，规划需要完成的任务：
- a. 识别主诉：患者说“我最近三天发烧、咳嗽、流鼻涕”。
- b. 提取关键信息：从对话中提取关键医学实体（症状、病史、用药、过敏史）。
- c. 判断时机：在医生问诊结束时，自动生成病历初稿；在医生疑惑时，主动提供诊断参考。
执行：
- 实时摘要与提取：调用[医学实体识别(NER)工具]，提取并结构化关键信息（如：症状: [发烧, 咳嗽, 流鼻涕]，持续时间: 3天）。
- 医学知识检索：基于提取的症状，智能体通过[RAG检索]从最新的医学知识库、药品说明书、临床指南中查找相关信息。
- 诊断建议推理：LLM综合“当前对话内容”和“检索到的医学知识”，进行推理分析。例如：“患者症状为流感样症状，当前季节流感病毒活跃，建议考虑流行性感冒，可推荐做咽拭子检测。”
反馈：
- 自动生成病历：问诊结束后，智能体自动将结构化的信息填入电子病历系统的[SOAP模板]（主观、客观、评估、计划）。
- 主动提示医生：在医生下达诊断指令前，智能体可以在医生的工作界面上做一个温和的提示：“根据主诉，疑似流感，是否需要开具奥司他韦或安排检测？”
- 自动化操作：医生确认后，智能体可自动调用[开具检测单API]或[开具处方API]。

场景三：软件开发AI程序员 (AI Programmer)

用户指令： “在项目里创建一个用户登录功能，需要邮箱注册、密码登录和JWT令牌验证。”

详细工作流：

代码

下载

执行

感知
接收用户需求

规划
LLM进行任务分解

反馈
总结汇报

代码生成

代码测试

代码部署

漏洞修复

工具: 代码生成

工具: 测试运行

工具: 部署脚本

工具: 调试器

工作流说明：

感知：智能体接收用户提出的自然语言需求。
规划：LLM大脑将宏大的需求分解为具体的开发子任务和文件结构：
- a. 后端：创建用户模型(User Model)、认证控制器(Auth Controller)、JWT工具函数。
- b. 前端：创建注册页面(Register Page)、登录页面(Login Page)、存储Token。
- c. 数据库：创建用户表(users table)。
- d. 测试：为API编写单元测试。
- e. 制定执行顺序：先模型和数据库 -> 再后端API -> 最后前端页面。
执行：
- 代码生成：智能体切换到“编码模式”，循环调用[代码生成工具]（或直接编写），依次创建models/user.py, routes/auth.py, frontend/src/pages/Login.vue等所有必要文件。
- 代码测试：每完成一个模块，智能体调用[测试运行工具]（如pytest）来执行测试，确保代码可用。
- 代码部署：如果测试通过，智能体可以调用[部署脚本工具]（如通过SSH执行命令），将代码部署到开发服务器进行集成测试。
反馈：
- 成功：智能体反馈：“登录功能已开发完成并部署至开发环境。后端API端点：POST /api/auth/login，前端页面路由：/login。已为您生成了初始测试用户。”
- 遇到错误：如果测试失败，智能体进入自我调试循环：
  - 感知错误：读取测试失败日志。
  - 规划：分析错误原因（如：数据库连接错误？JWT密钥未设置？）。
  - 执行：调用[调试器工具]修改代码，或为项目创建.env文件并设置环境变量。
  - 反馈：重新运行测试，直到成功。

总结

这三个工作流展示了智能体在不同领域的通用模式：

电商助手：侧重于多工具协调和多轮对话，核心是理解用户意图和优化决策。
医疗助手：侧重于实时感知和信息结构化，核心是 passively and actively assisting（被动与主动辅助） without disrupting（不打断）工作流程。
程序员：侧重于任务分解和自动化闭环，核心是将抽象需求转化为具体的、可执行的文件操作和命令。

它们共同证明了：智能体的强大，不在于单一算法的突破，而在于将LLM的认知能力与一系列工具API无缝衔接，组成一个能自主完成复杂任务的系统。

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

cover

当AI把用户数据当乐高拼：初级开发者的创意是如何变成稀缺资源的？

TCP/IP协议：MCP提示词工程：上下文注入的艺术与科学

TCP/IP协议作为计算机网络通信的核心基础，其结构虽复杂，但理解其内部原理能帮助开发者更高效地构建稳定、安全、可靠的网络通信程序。无论你是系统开发者、后端工程师、嵌入式程序员，还是网络安全研究员，深入掌握TCP/IP协议栈都是提升技能的关键一环。本文将从基础概念出发，深入剖析TCP/IP各层协议的结构、工作机制、报文格式、连接流程、拥塞控制等关键内容，并结合实际应用场景、抓包案例进行解析，帮助读

TCP/IP协议：智能体安全与可信AI：防护机制与伦理考量

TCP/IP协议作为计算机网络通信的核心基础，其结构虽复杂，但理解其内部原理能帮助开发者更高效地构建稳定、安全、可靠的网络通信程序。无论你是系统开发者、后端工程师、嵌入式程序员，还是网络安全研究员，深入掌握TCP/IP协议栈都是提升技能的关键一环。本文将从基础概念出发，深入剖析TCP/IP各层协议的结构、工作机制、报文格式、连接流程、拥塞控制等关键内容，并结合实际应用场景、抓包案例进行解析，帮助读

所有评论(0)

查看更多评论

matlab_python22

@matlab_python22

已为社区贡献31条内容