AI-Agent简介
AI Agent是一种具备自主感知、规划、执行和反馈能力的智能系统,能够独立完成复杂目标而无需人类持续干预。其核心组件包括LLM(负责意图理解和任务分解)、Memory(解决信息遗忘问题)、Planning(任务拆解和优化)和Tool Use(外部工具调用)。该系统适用于多步骤、跨工具的复杂任务,如信息处理、流程执行和长期跟踪等场景,但不适合简单单点任务。目前AI Agent通过工作流设计和工具整
1 是
- 具备“自感知、自规划、自执行、自反馈”的AI系统。核心特点是:“无需人类持续关注,就能完成复杂目标”。
- IBM:通过设计工作流、借助可用的工具,自动执行的任务的系统。
2 Why
解决当前AI工具被动响应、能力单一的问题:用户需要明确指令、分步操作、无法自动处理跨工具的复杂任务。
3 How
3.1 标准工作流程
感知Perception
接受用户指令、理解目标、环境 如“编写一份新能源汽车报告”
规划Planning
拆解任务、规划执行路径 1) 搜索新能源汽车销售数据;
2) 分析Top3品牌策略;
3) 收集国家政策和趋势
4) 输出报告;
5) 各步调用的工具和输出。
执行Execution
调用工具、执行步骤
1) 调用API、工具;
2) 容错。
反馈Feedback
验证结果与迭代优化
1) 检查是否满足结果;
2) 如不满足,重新调整,继续执行。
3.2 核心组件

3.2.1 LLM:
智能的大脑。负责:
1) 理解用户意图;
2) 分解任务步骤;
3) 明确可调用工具
3.2.2 Memory
为了让大模型能够解决复杂问题,克服大模型的会话遗忘(会不断忘记之前的步骤和决策),模拟人类大脑,构建了memory。
1) 信息长期保留:存储超过LLM上下文窗口的的信息,避免遗忘。
2) 确保决策连续性:跟踪多任务进展和中间过程,保证决策的连贯。
3) 个性化:记录日志和用户交互日志,实现自我改进何知识更新。
3.2.3 Planning规划
1)子目标和分解:LLM Agent 能够将大型任务分解为较小的、可管理的子目标,以便有效的处理复杂任务;
2)反思和细化:LLM Agent 可以对过去的行为进行自我批评和反省,从错误中吸取经验教训,并为接下来的行动进行分析、总结和提炼,这种反思和细化可以帮助 Agents 提高自身的智能和适应性,从而提高最终结果的质量。
3.2.4 Tool Use
可以学习如何调用外部 API,以获取模型权重中缺少的额外信息,这些信息通常在预训练后很难更改,包括当前信息、代码执行能力、对专有信息源的访问等。
4 Where
适用:复杂任务,多步骤、跨工具、需自主决策的。
不适用:简单的、单点任务。如翻译一句话、画一只猫。
- 信息处理类:搜集->整理->分析。如:手机行业趋势分析?
- 流程执行类:按步骤、跨工具。如给本月生日同事发祝福邮件。
- 长期跟踪类:持续监控+动态调整。如跟踪对方报价,若低于我方10%,给出新的调价建议。
5 思考与实践
5.1 问题
5.1.1 人类的任务种类有很对,LLM是如何规划的?如编码与规划是不同拆分?
6 参考
- LLM Agent 简介 简洁,适合了解
https://cloud.tencent.com/developer/article/2378832 - Agent近期记忆技术及落地实践整理 对memory有深入的讲解,图文全面 https://cloud.tencent.com/developer/article/2588486?policyId=20240000&traceId=&frompage=homepagehttps://cloud.tencent.com/developer/article/2588486?policyId=20240000&traceId=&frompage=homepage
- Agentic AI基础设施实践经验系列(三):Agent记忆模块的最佳实践 干货多,总结简练
【优】 https://aws.amazon.com/cn/blogs/china/agentic-ai-infrastructure-deep-practice-experience-thinking-series-three-best-practices-for-agent-memory-module/
更多推荐



所有评论(0)