成为基于AI Agent的创造者?!
本文讨论了成为基于 Agent 的创造者的学习路径以及数字员工“进化论”中关于 AI 能力应用需做妥协和平衡的问题。关键要点包括:
1.Agent 工程迭代范式:Agent 工程如同传统软件工程学有迭代范式,具体为梳理流程、「任务」工具化、建立规划和迭代优化。
2.梳理流程:梳理工作流程 SOP,将其拆解成多个单一「任务」和多个「任务执行流程」。
3.「任务」工具化:把每个「任务」自动化,形成一系列小工具,使机器能够完成单一任务。
4.建立规划:串联工具,基于 agent 框架让 bot 规划「任务执行流程」。
5.迭代优化:不断迭代优化「任务」工具和「任务执行流程」规划,打造能应对实际场景的Agent。
6.数字员工“进化论”:从 copilot 到 Agent,有从实习到转正、从副驾到主驾的转变。
7.AI 能力应用:在固化流程和让 AI 自主思考方面,需基于 AI 能力作出妥协和平衡。
一.Agent工程基础
如同传统的软件工程学, Agent工程也有一个迭代的范式:
1.梳理流程: 梳理工作流程SOP, 并拆解成多个单一「任务」和多个「任务执行流程」.
2.「任务」工具化: 自动化每一个「任务」, 形成一系列的小工具, 让机器能完成每一个单一任务.
3.建立规划: 串联工具, 基于agent框架让bot来规划「任务执行流程」.
4.迭代优化: 不停迭代优化「任务」工具和「任务执行流程」规划, 造就能应对实际场景的Agent.


解读:
1. 中间核心:Agent
-
这是“大脑核心”,负责协调所有环节。
-
它接收用户的输入、做出决策,然后调用合适的模块去完成任务。
2. 记忆系统(Memory)
-
短期记忆(Short-term memory)
存当前对话或当前任务的临时信息,类似“RAM”。 -
长期记忆(Long-term memory)
存历史知识、过往经验,类似“硬盘”。 -
Agent 会用记忆来做更智能的决策(比如记住你之前的喜好)。
3. 工具系统(Tools)
Agent 并不什么都会自己算,而是可以调用外部工具,比如:
-
Calendar():查日程 -
Calculator():算数 -
CodeInterpreter():运行代码、分析数据 -
Search():上网查信息 -
...more:可以扩展更多工具(数据库、API等)
特点:工具是插件化的,Agent 可以根据需要调用。
4. 规划系统(Planning)
-
这是 Agent 的“项目经理”,负责怎么做事。
-
规划过程包含:
-
Reflection(反思):回顾是否做得好,有没有问题。
-
Self-critics(自我批评):发现不足并改进。
-
Chain of thoughts(思维链):一步步推理。
-
Subgoal decomposition(子目标分解):把大任务拆成小步骤。
-
5. 行动系统(Action)
-
最终执行具体任务的地方。
-
执行前会经过“规划→调用工具→整合结果”这一套流程。
6. 信息流动
-
实线箭头:主要流程
(Agent 调用工具、规划行动、存取记忆) -
虚线箭头:辅助流程
(比如规划模块用记忆来优化任务执行)
💡 总结一句话:
这张图就是在说——
AI Agent = 有记忆的智能中枢 + 会规划的任务经理 + 能调用外部工具的多功能助手,它像人类一样可以思考、回顾、分解任务,并且能用“外脑”工具帮自己完成工作。
二.数字员工“进化论”
《从copilot 到 Agent, 从实习到转正, 从副驾到主驾》
-- 到底是固化流程, 还是让AI自主思考, 需要在对AI能力基础上作出妥协和平衡.
| 描述 | 示例 | |
| L1 Tool | 人类完成所有工作,没有任何明显的AI辅助 | 绝大部分应用 |
| L2 Chatbot | 人类直接完成绝大部分工作。人类向AI询问意见,了解信息,AI提供信息和建议,但不直接工作 | 初代ChatGPT |
| L3 Copilot | 人类和AI进行写作,工作量相当。AI根据人类要求完成工作初稿,人类进行目标设定,修改调整,最后确认 | Github Copilot、Midjourney、ChatGPT with Plugin |
| L4 Agent | AI完成绝大部分工作,人类负责设定目标、提供资源和监督 结果。AI完成任务拆分,工具选择,进度控制,实现目标后自助结束工作 | AutoGPT |
| L5 Intelligence | 完全无需人类监督,AI自主拆解目标,寻找资源,选择并使用工具,完成全部工作,人类只需给出初始目标 | 类冯·诺依曼机器人 或者……人? |

更多推荐

所有评论(0)