1 是

  1. 具备“自感知、自规划、自执行、自反馈”的AI系统。核心特点是:“无需人类持续关注,就能完成复杂目标”。
  2. IBM:通过设计工作流、借助可用的工具,自动执行的任务的系统。

2 Why

解决当前AI工具被动响应、能力单一的问题:用户需要明确指令、分步操作、无法自动处理跨工具的复杂任务。
在这里插入图片描述

3 How

3.1 标准工作流程

感知Perception

接受用户指令、理解目标、环境 如“编写一份新能源汽车报告”

规划Planning

拆解任务、规划执行路径 1) 搜索新能源汽车销售数据;
2) 分析Top3品牌策略;
3) 收集国家政策和趋势
4) 输出报告;
5) 各步调用的工具和输出。

执行Execution

调用工具、执行步骤
1) 调用API、工具;
2) 容错。

反馈Feedback

验证结果与迭代优化
1) 检查是否满足结果;
2) 如不满足,重新调整,继续执行。

3.2 核心组件

在这里插入图片描述

3.2.1 LLM:

智能的大脑。负责:
1) 理解用户意图;
2) 分解任务步骤;
3) 明确可调用工具

3.2.2 Memory

为了让大模型能够解决复杂问题,克服大模型的会话遗忘(会不断忘记之前的步骤和决策),模拟人类大脑,构建了memory。
1) 信息长期保留:存储超过LLM上下文窗口的的信息,避免遗忘。
2) 确保决策连续性:跟踪多任务进展和中间过程,保证决策的连贯。
3) 个性化:记录日志和用户交互日志,实现自我改进何知识更新。

3.2.3 Planning规划

1)子目标和分解:LLM Agent 能够将大型任务分解为较小的、可管理的子目标,以便有效的处理复杂任务;
2)反思和细化:LLM Agent 可以对过去的行为进行自我批评和反省,从错误中吸取经验教训,并为接下来的行动进行分析、总结和提炼,这种反思和细化可以帮助 Agents 提高自身的智能和适应性,从而提高最终结果的质量。

3.2.4 Tool Use

可以学习如何调用外部 API,以获取模型权重中缺少的额外信息,这些信息通常在预训练后很难更改,包括当前信息、代码执行能力、对专有信息源的访问等。
在这里插入图片描述

4 Where

适用:复杂任务,多步骤、跨工具、需自主决策的。
不适用:简单的、单点任务。如翻译一句话、画一只猫。

  1. 信息处理类:搜集->整理->分析。如:手机行业趋势分析?
  2. 流程执行类:按步骤、跨工具。如给本月生日同事发祝福邮件。
  3. 长期跟踪类:持续监控+动态调整。如跟踪对方报价,若低于我方10%,给出新的调价建议。

5 思考与实践

5.1 问题

5.1.1 人类的任务种类有很对,LLM是如何规划的?如编码与规划是不同拆分?

6 参考

  1. LLM Agent 简介 简洁,适合了解
    https://cloud.tencent.com/developer/article/2378832
  2. Agent近期记忆技术及落地实践整理 对memory有深入的讲解,图文全面 https://cloud.tencent.com/developer/article/2588486?policyId=20240000&traceId=&frompage=homepagehttps://cloud.tencent.com/developer/article/2588486?policyId=20240000&traceId=&frompage=homepage
  3. Agentic AI基础设施实践经验系列(三):Agent记忆模块的最佳实践 干货多,总结简练
    【优】 https://aws.amazon.com/cn/blogs/china/agentic-ai-infrastructure-deep-practice-experience-thinking-series-three-best-practices-for-agent-memory-module/
Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐