成为基于AI Agent的创造者？！

槐玉枝LX

1004人浏览 · 2025-08-11 13:30:44

槐玉枝LX · 2025-08-11 13:30:44 发布

本文讨论了成为基于 Agent 的创造者的学习路径以及数字员工“进化论”中关于 AI 能力应用需做妥协和平衡的问题。关键要点包括：
1.Agent 工程迭代范式：Agent 工程如同传统软件工程学有迭代范式，具体为梳理流程、「任务」工具化、建立规划和迭代优化。
2.梳理流程：梳理工作流程 SOP，将其拆解成多个单一「任务」和多个「任务执行流程」。
3.「任务」工具化：把每个「任务」自动化，形成一系列小工具，使机器能够完成单一任务。
4.建立规划：串联工具，基于 agent 框架让 bot 规划「任务执行流程」。
5.迭代优化：不断迭代优化「任务」工具和「任务执行流程」规划，打造能应对实际场景的Agent。
6.数字员工“进化论”：从 copilot 到 Agent，有从实习到转正、从副驾到主驾的转变。
7.AI 能力应用：在固化流程和让 AI 自主思考方面，需基于 AI 能力作出妥协和平衡。

一.Agent工程基础

如同传统的软件工程学, Agent工程也有一个迭代的范式:

1.梳理流程: 梳理工作流程SOP, 并拆解成多个单一「任务」和多个「任务执行流程」.
2.「任务」工具化: 自动化每一个「任务」, 形成一系列的小工具, 让机器能完成每一个单一任务.
3.建立规划: 串联工具, 基于agent框架让bot来规划「任务执行流程」.
4.迭代优化: 不停迭代优化「任务」工具和「任务执行流程」规划, 造就能应对实际场景的Agent.

解读：

1. 中间核心：Agent

这是“大脑核心”，负责协调所有环节。
它接收用户的输入、做出决策，然后调用合适的模块去完成任务。

2. 记忆系统（Memory）

短期记忆（Short-term memory）
存当前对话或当前任务的临时信息，类似“RAM”。
长期记忆（Long-term memory）
存历史知识、过往经验，类似“硬盘”。
Agent 会用记忆来做更智能的决策（比如记住你之前的喜好）。

3. 工具系统（Tools）

Agent 并不什么都会自己算，而是可以调用外部工具，比如：

Calendar()：查日程
Calculator()：算数
CodeInterpreter()：运行代码、分析数据
Search()：上网查信息
...more：可以扩展更多工具（数据库、API等）

特点：工具是插件化的，Agent 可以根据需要调用。

4. 规划系统（Planning）

这是 Agent 的“项目经理”，负责怎么做事。
规划过程包含：
- Reflection（反思）：回顾是否做得好，有没有问题。
- Self-critics（自我批评）：发现不足并改进。
- Chain of thoughts（思维链）：一步步推理。
- Subgoal decomposition（子目标分解）：把大任务拆成小步骤。

5. 行动系统（Action）

最终执行具体任务的地方。
执行前会经过“规划→调用工具→整合结果”这一套流程。

6. 信息流动

实线箭头：主要流程
（Agent 调用工具、规划行动、存取记忆）
虚线箭头：辅助流程
（比如规划模块用记忆来优化任务执行）

💡 总结一句话：
这张图就是在说——
AI Agent = 有记忆的智能中枢 + 会规划的任务经理 + 能调用外部工具的多功能助手，它像人类一样可以思考、回顾、分解任务，并且能用“外脑”工具帮自己完成工作。

二.数字员工“进化论”

《从copilot 到 Agent, 从实习到转正, 从副驾到主驾》
-- 到底是固化流程, 还是让AI自主思考, 需要在对AI能力基础上作出妥协和平衡.

Generative AI Application Level
	描述	示例
L1 Tool	人类完成所有工作，没有任何明显的AI辅助	绝大部分应用
L2 Chatbot	人类直接完成绝大部分工作。人类向AI询问意见，了解信息，AI提供信息和建议，但不直接工作	初代ChatGPT
L3 Copilot	人类和AI进行写作，工作量相当。AI根据人类要求完成工作初稿，人类进行目标设定，修改调整，最后确认	Github Copilot、Midjourney、ChatGPT with Plugin
L4 Agent	AI完成绝大部分工作，人类负责设定目标、提供资源和监督结果。AI完成任务拆分，工具选择，进度控制，实现目标后自助结束工作	AutoGPT
L5 Intelligence	完全无需人类监督，AI自主拆解目标，寻找资源，选择并使用工具，完成全部工作，人类只需给出初始目标	类冯·诺依曼机器人或者……人?

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

基于 Spring AI + Milvus 的 RAG 混合检索实战

本文介绍了基于Spring AI和Milvus构建企业级RAG知识库问答系统的完整实现方案。系统采用两阶段架构：首先通过轻量级LLM调用进行意图分类（如一般咨询、历史查询、解决方案查找），仅当需要检索时才触发完整的混合检索链路。核心创新点包括：1）向量检索与BM25的RRF融合策略；2）领域词扩展与同义映射的query改写；3）DashScope Rerank精排与多重过滤机制；4）意图路由与后处

2048 AI社区

2026 半导体项目管理工具选型指南：飞书项目、PowerProject、禅道怎么选

回到最初那个问题——半导体行业到底应该怎么选项目管理工具？经验上有几条朴素的判断：项目复杂度低、以单一软件/算法迭代为主，禅道与飞书项目都能撑住，看团队对生态的偏好。偏传统集团 IPD、强调主计划与资源平衡，在方法论上有自己的位置。一旦同时面对"多 Tape-out + 多衍生版本 + 车规可追溯 + 管理层可视化 + AI/开放生态"，飞书项目在"复杂场景的承接力"上的体感会逐步显现。工具不能替

2048 AI社区

Multi-Agent 开发最佳实践：从任务拆解到协同交付的工程化指南

Multi-Agent 开发不是堆多个 Agent，而是通过主从分工、任务拆解、状态管理、权限隔离和结果审查，把复杂任务变成可协同、可验证、可交付的工程流程。本文系统讲解 Multi-Agent 架构设计、上下文传递、通信机制、成本控制、安全治理与评估方法，帮助开发者避免空转和过度设计，构建稳定可靠的 AI Agent 协同系统。