智能体的工作流
LLM综合“当前对话内容”和“检索到的医学知识”,进行推理分析。:智能体生成一个包含所有商品、总价、推荐理由的完整方案,通过自然语言与用户交互:“为您找到了8件商品,总价498元,包含XXX...,您看可以吗?:如果测试通过,智能体可以调用[部署脚本工具](如通过SSH执行命令),将代码部署到开发服务器进行集成测试。:问诊结束后,智能体自动将结构化的信息填入电子病历系统的[SOAP模板](主观、客
每个工作流都遵循 “感知 -> 规划 -> 执行 -> 反馈” 的经典智能体循环。
目录
场景一:电商全能购物助手 (Super Shopping Agent)
场景二:医疗AI医生助手 (AI Doctor's Assistant)
场景一:电商全能购物助手 (Super Shopping Agent)
用户指令: “帮我为下周末的8人户外野餐准备所有必需品,预算500元左右。”
详细工作流:
图表
代码
下载
执行
感知
接收用户指令
规划
LLM分解任务
反馈
生成最终方案
搜索与比价
筛选与决策
加入购物车
寻求用户确认
工具: 商品搜索API
工具: 比价算法
工具: 购物车API
工具: 自然语言交互
工作流说明:
-
感知:智能体通过文本或语音接口接收用户指令。
-
规划:LLM大脑将模糊需求分解为可执行任务:
-
a. 理解核心要素:
场景=户外野餐
,人数=8人
,预算=500元
,时间=下周末
。 -
b. 推断所需商品类别:
一次性餐具
、野餐垫
、便携食物
、饮料
、零食
、垃圾袋
等。 -
c. 制定执行计划:先搜索,再比价,然后组合方案,最后确认。
-
-
执行:
-
搜索与比价:智能体并行地调用多个[商品搜索API]和[比价API],获取各类别商品的列表、价格、销量、评价。
-
筛选与决策:智能体根据预算和人数(8人)进行计算和分配(例如:餐具至少买8套,食物分量要足够)。它利用LLM的理解能力,筛选出性价比高、评价好的商品。
-
加入购物车:智能体调用[购物车API],将选中的所有商品加入购物车。
-
寻求用户确认:智能体生成一个包含所有商品、总价、推荐理由的完整方案,通过自然语言与用户交互:“为您找到了8件商品,总价498元,包含XXX...,您看可以吗?”
-
-
反馈:
-
若用户说“可以”,智能体调用[下单API]完成支付。
-
若用户说“不要薯片,换成果冻”,则进入新一轮循环,执行“移除商品->搜索果冻->加入购物车->再次确认”的流程。
-
最终,将订单结果反馈给用户:“野餐套餐已下单成功!预计周六上午送达。”
-
场景二:医疗AI医生助手 (AI Doctor's Assistant)
场景: 医生在诊室与患者交流,智能体实时辅助。
详细工作流:
图表
代码
下载
执行
感知
实时语音转文本
规划
LLM理解医患对话
反馈
生成结构化病历
实时摘要与提取
医学知识检索
诊断建议推理
工具: 医学实体识别NER
工具: 医学知识库RAG
工具: 诊断指南API
工作流说明:
-
感知:智能体通过麦克风实时收取医患对话,并通过[语音识别(ASR)API]将其转为文本流。
-
规划:LLM大脑持续监控对话,规划需要完成的任务:
-
a. 识别主诉:患者说“我最近三天发烧、咳嗽、流鼻涕”。
-
b. 提取关键信息:从对话中提取关键医学实体(症状、病史、用药、过敏史)。
-
c. 判断时机:在医生问诊结束时,自动生成病历初稿;在医生疑惑时,主动提供诊断参考。
-
-
执行:
-
实时摘要与提取:调用[医学实体识别(NER)工具],提取并结构化关键信息(如:
症状: [发烧, 咳嗽, 流鼻涕]
,持续时间: 3天
)。 -
医学知识检索:基于提取的症状,智能体通过[RAG检索]从最新的医学知识库、药品说明书、临床指南中查找相关信息。
-
诊断建议推理:LLM综合“当前对话内容”和“检索到的医学知识”,进行推理分析。例如:“患者症状为流感样症状,当前季节流感病毒活跃,建议考虑流行性感冒,可推荐做咽拭子检测。”
-
-
反馈:
-
自动生成病历:问诊结束后,智能体自动将结构化的信息填入电子病历系统的[SOAP模板](主观、客观、评估、计划)。
-
主动提示医生:在医生下达诊断指令前,智能体可以在医生的工作界面上做一个温和的提示:“根据主诉,疑似流感,是否需要开具奥司他韦或安排检测?”
-
自动化操作:医生确认后,智能体可自动调用[开具检测单API]或[开具处方API]。
-
场景三:软件开发AI程序员 (AI Programmer)
用户指令: “在项目里创建一个用户登录功能,需要邮箱注册、密码登录和JWT令牌验证。”
详细工作流:
代码
下载
执行
感知
接收用户需求
规划
LLM进行任务分解
反馈
总结汇报
代码生成
代码测试
代码部署
漏洞修复
工具: 代码生成
工具: 测试运行
工具: 部署脚本
工具: 调试器
工作流说明:
-
感知:智能体接收用户提出的自然语言需求。
-
规划:LLM大脑将宏大的需求分解为具体的开发子任务和文件结构:
-
a.
后端:创建用户模型(User Model)、认证控制器(Auth Controller)、JWT工具函数
。 -
b.
前端:创建注册页面(Register Page)、登录页面(Login Page)、存储Token
。 -
c.
数据库:创建用户表(users table)
。 -
d.
测试:为API编写单元测试
。 -
e. 制定执行顺序:先模型和数据库 -> 再后端API -> 最后前端页面。
-
-
执行:
-
代码生成:智能体切换到“编码模式”,循环调用[代码生成工具](或直接编写),依次创建
models/user.py
,routes/auth.py
,frontend/src/pages/Login.vue
等所有必要文件。 -
代码测试:每完成一个模块,智能体调用[测试运行工具](如pytest)来执行测试,确保代码可用。
-
代码部署:如果测试通过,智能体可以调用[部署脚本工具](如通过SSH执行命令),将代码部署到开发服务器进行集成测试。
-
-
反馈:
-
成功:智能体反馈:“登录功能已开发完成并部署至开发环境。后端API端点:POST /api/auth/login,前端页面路由:/login。已为您生成了初始测试用户。”
-
遇到错误:如果测试失败,智能体进入自我调试循环:
-
感知错误:读取测试失败日志。
-
规划:分析错误原因(如:数据库连接错误?JWT密钥未设置?)。
-
执行:调用[调试器工具]修改代码,或为项目创建
.env
文件并设置环境变量。 -
反馈:重新运行测试,直到成功。
-
-
总结
这三个工作流展示了智能体在不同领域的通用模式:
-
电商助手:侧重于多工具协调和多轮对话,核心是理解用户意图和优化决策。
-
医疗助手:侧重于实时感知和信息结构化,核心是 passively and actively assisting(被动与主动辅助) without disrupting(不打断) 工作流程。
-
程序员:侧重于任务分解和自动化闭环,核心是将抽象需求转化为具体的、可执行的文件操作和命令。
它们共同证明了:智能体的强大,不在于单一算法的突破,而在于将LLM的认知能力与一系列工具API无缝衔接,组成一个能自主完成复杂任务的系统。
更多推荐
所有评论(0)