每个工作流都遵循 “感知 -> 规划 -> 执行 -> 反馈” 的经典智能体循环。

目录

场景一:电商全能购物助手 (Super Shopping Agent)

详细工作流:

场景二:医疗AI医生助手 (AI Doctor's Assistant)

详细工作流:

场景三:软件开发AI程序员 (AI Programmer)

详细工作流:

总结



场景一:电商全能购物助手 (Super Shopping Agent)

用户指令: “帮我为下周末的8人户外野餐准备所有必需品,预算500元左右。”

详细工作流:

图表

代码

下载

执行

感知
接收用户指令

规划
LLM分解任务

反馈
生成最终方案

搜索与比价

筛选与决策

加入购物车

寻求用户确认

工具: 商品搜索API

工具: 比价算法

工具: 购物车API

工具: 自然语言交互

工作流说明:

  1. 感知:智能体通过文本或语音接口接收用户指令。

  2. 规划:LLM大脑将模糊需求分解为可执行任务:

    • a. 理解核心要素:场景=户外野餐人数=8人预算=500元时间=下周末

    • b. 推断所需商品类别:一次性餐具野餐垫便携食物饮料零食垃圾袋等。

    • c. 制定执行计划:先搜索,再比价,然后组合方案,最后确认。

  3. 执行

    • 搜索与比价:智能体并行地调用多个[商品搜索API]和[比价API],获取各类别商品的列表、价格、销量、评价。

    • 筛选与决策:智能体根据预算和人数(8人)进行计算和分配(例如:餐具至少买8套,食物分量要足够)。它利用LLM的理解能力,筛选出性价比高、评价好的商品。

    • 加入购物车:智能体调用[购物车API],将选中的所有商品加入购物车。

    • 寻求用户确认:智能体生成一个包含所有商品、总价、推荐理由的完整方案,通过自然语言与用户交互:“为您找到了8件商品,总价498元,包含XXX...,您看可以吗?”

  4. 反馈

    • 若用户说“可以”,智能体调用[下单API]完成支付。

    • 若用户说“不要薯片,换成果冻”,则进入新一轮循环,执行“移除商品->搜索果冻->加入购物车->再次确认”的流程。

    • 最终,将订单结果反馈给用户:“野餐套餐已下单成功!预计周六上午送达。”


场景二:医疗AI医生助手 (AI Doctor's Assistant)

场景: 医生在诊室与患者交流,智能体实时辅助。

详细工作流:

图表

代码

下载

执行

感知
实时语音转文本

规划
LLM理解医患对话

反馈
生成结构化病历

实时摘要与提取

医学知识检索

诊断建议推理

工具: 医学实体识别NER

工具: 医学知识库RAG

工具: 诊断指南API

工作流说明:

  1. 感知:智能体通过麦克风实时收取医患对话,并通过[语音识别(ASR)API]将其转为文本流。

  2. 规划:LLM大脑持续监控对话,规划需要完成的任务:

    • a. 识别主诉:患者说“我最近三天发烧、咳嗽、流鼻涕”。

    • b. 提取关键信息:从对话中提取关键医学实体(症状、病史、用药、过敏史)。

    • c. 判断时机:在医生问诊结束时,自动生成病历初稿;在医生疑惑时,主动提供诊断参考。

  3. 执行

    • 实时摘要与提取:调用[医学实体识别(NER)工具],提取并结构化关键信息(如:症状: [发烧, 咳嗽, 流鼻涕]持续时间: 3天)。

    • 医学知识检索:基于提取的症状,智能体通过[RAG检索]从最新的医学知识库、药品说明书、临床指南中查找相关信息。

    • 诊断建议推理:LLM综合“当前对话内容”和“检索到的医学知识”,进行推理分析。例如:“患者症状为流感样症状,当前季节流感病毒活跃,建议考虑流行性感冒,可推荐做咽拭子检测。”

  4. 反馈

    • 自动生成病历:问诊结束后,智能体自动将结构化的信息填入电子病历系统的[SOAP模板](主观、客观、评估、计划)。

    • 主动提示医生:在医生下达诊断指令前,智能体可以在医生的工作界面上做一个温和的提示:“根据主诉,疑似流感,是否需要开具奥司他韦或安排检测?”

    • 自动化操作:医生确认后,智能体可自动调用[开具检测单API]或[开具处方API]。


场景三:软件开发AI程序员 (AI Programmer)

用户指令: “在项目里创建一个用户登录功能,需要邮箱注册、密码登录和JWT令牌验证。”

详细工作流:

代码

下载

执行

感知
接收用户需求

规划
LLM进行任务分解

反馈
总结汇报

代码生成

代码测试

代码部署

漏洞修复

工具: 代码生成

工具: 测试运行

工具: 部署脚本

工具: 调试器

工作流说明:

  1. 感知:智能体接收用户提出的自然语言需求。

  2. 规划:LLM大脑将宏大的需求分解为具体的开发子任务和文件结构:

    • a. 后端:创建用户模型(User Model)、认证控制器(Auth Controller)、JWT工具函数

    • b. 前端:创建注册页面(Register Page)、登录页面(Login Page)、存储Token

    • c. 数据库:创建用户表(users table)

    • d. 测试:为API编写单元测试

    • e. 制定执行顺序:先模型和数据库 -> 再后端API -> 最后前端页面。

  3. 执行

    • 代码生成:智能体切换到“编码模式”,循环调用[代码生成工具](或直接编写),依次创建models/user.pyroutes/auth.pyfrontend/src/pages/Login.vue等所有必要文件。

    • 代码测试:每完成一个模块,智能体调用[测试运行工具](如pytest)来执行测试,确保代码可用。

    • 代码部署:如果测试通过,智能体可以调用[部署脚本工具](如通过SSH执行命令),将代码部署到开发服务器进行集成测试。

  4. 反馈

    • 成功:智能体反馈:“登录功能已开发完成并部署至开发环境。后端API端点:POST /api/auth/login,前端页面路由:/login。已为您生成了初始测试用户。”

    • 遇到错误:如果测试失败,智能体进入自我调试循环

      • 感知错误:读取测试失败日志。

      • 规划:分析错误原因(如:数据库连接错误?JWT密钥未设置?)。

      • 执行:调用[调试器工具]修改代码,或为项目创建.env文件并设置环境变量。

      • 反馈:重新运行测试,直到成功。


总结

这三个工作流展示了智能体在不同领域的通用模式:

  1. 电商助手:侧重于多工具协调多轮对话,核心是理解用户意图和优化决策。

  2. 医疗助手:侧重于实时感知信息结构化,核心是 passively and actively assisting(被动与主动辅助) without disrupting(不打断) 工作流程。

  3. 程序员:侧重于任务分解自动化闭环,核心是将抽象需求转化为具体的、可执行的文件操作和命令。

它们共同证明了:智能体的强大,不在于单一算法的突破,而在于将LLM的认知能力与一系列工具API无缝衔接,组成一个能自主完成复杂任务的系统。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐