01

Agent发展的5个阶段

AI Agent不是突然冒出来的成熟产物,而是随着底层大模型推理能力的不断增强,逐步走向完善的。整体上,我们可以将它的发展划分为五个阶段(L1–L5):

L1:简单步骤跟随 

在这个初级阶段,Agent的能力仅限于按照用户或开发者预先设定的确切指令,一步步完成任务。比如,你可以让它“打开邮件,阅读第一封未读邮件”,它更像一个智能化的执行器,但缺乏自主判断和更复杂的决策能力。

L2:确定性任务自动化

进阶到L2,Agent能够基于对确定性任务的描述,在预设的动作空间内自动完成一系列步骤。它不再需要每一步都精确指令,而是能在给定规则下完成相对封闭、可预测的流程,比如你可以让它“查询今天上海的天气”。在这一过程中,Agent 会自动调用并整合多个数据源。

L3:战略任务自动化

这是当前许多先进Agent正在努力达到的阶段。在L3,Agent可以根据用户指定的高层次任务目标,自主调用各种资源和工具,规划并执行步骤,并能根据中间反馈,迭代优化计划。

L4:记忆和上下文感知

在这个阶段,Agent将具备更深层次的智能,能够感知用户在长期交互中的上下文,理解用户过去的记忆,并有时主动提供个性化的服务。它能记住你的偏好、习惯,甚至能预测你的需求,比如“告诉扫地机器人今晚打扫房间”,它会根据你的日常习惯,避开你常用的区域,或根据天气状况推荐何时清洗窗户。

L5:数字人格

这是Agent发展的终极目标,智能体将能代表用户完成更复杂的事务,甚至能与他人进行交互,并确保其安全和可靠性。这个时候,它可能不仅仅是你的助理,更是你在数字世界中的一个分身,能够独立思考、决策,并保护你的利益。

目前,随着推理大模型的进一步成熟,以及Manus、百度文心智能体平台、扣子空间、通义千问智能体等通用Agent的出现,企业AI Agent的应用正加速从L2向L3阶段迈进。它们在执行确定性流程和一定程度的自主规划方面,已经表现出色;但在真正拥有长期记忆、上下文理解和主动服务方面,仍有很长的路要走。


02

Agent关键组件和架构

一个AI Agent之所以能够“智能”地运作,离不开其背后精密的组件协同和逻辑架构。

1、5个关键组件

就像人类的思考和行动一样,Agent也有一套完整的认知与执行系统:

感知:它是智能体与外部环境交互的基础接口,负责收集和解析环境数据,包括文本、图像和声音等。

规划:作为智能体的决策中心,它负责将复杂的总目标分解成可执行的步骤,并制定实现策略。这里不得不提的是“思维链”,这种提示技术已成为提高大模型在复杂任务表现上的标准方法,它让Agent能像人类一样进行逐步推理。

记忆:存储着历史交互、知识积累和临时任务数据,是Agent实现上下文感知和长期学习的基础。

工具使用:通过调用外部资源,如API、代码库、RPA或应用程序,来扩展自身能力,是Agent在企业环境中实现价值的关键。

行动:是感知、规划、记忆和工具使用的最终成果,也是智能体执行任务和与环境交互的具体表现。

2、架构逻辑图

把这些组件连接起来,Agent 的逻辑架构也就一目了然。整条信息流清晰呈现了其从输入、处理到输出的完整路径:

来源@顿悟山丘智库

用户输入层: Agent的起点,接收用户以图文、语音、视频等多种形式提供的指令或信息。

接入网关层:负责统一接口管理,进行身份认证、协议转换和路由,确保输入信息能够安全、高效地进入Agent的核心处理区。

意图识别层:对输入的原始数据进行预处理、意图分类和实体提取,将非结构化的用户指令转化为Agent能够理解的结构化信息。

推理决策层:这是Agent的核心大脑,负责任务的规划、策略的筛选、大语言模型的推理和最终决策的验证。它决定了Agent下一步“做什么”和“怎么做”。

工具执行层:根据决策层的指令,调用并执行相应的工具,如注册、MCP、API、代码执行等,并处理工具返回的结果。

结果生成层:将工具执行后的结果或推理决策的产出,进行内容组装、格式化,并进行质量优化,使其符合用户阅读和理解的习惯。

用户输出层:将处理完成并格式化的结果呈现给用户。

除此之外,还有三个重要的支撑模块,即管理支持、记忆系统以及知识库,它们共同构建了Agent的基本架构。


03

企业级Agent的两种类型

在企业应用层面,Agent可以根据其主要解决的问题和工作方式,大致分为两大类:

1、流程自动化型

这类Agent的核心在于“自动化”,它们依据企业内已经固定的工作流和明确的规则,执行重复性、规范化的任务。这类Agent的优势在于提高效率、降低错误率、节省人力成本。

比如,财务部门的发票报销流程、企业内部的业务审批流、员工的学习考试系统等,都是流程自动化型Agent的典型应用场景。它们能够精准地遵循既定步骤,无需人工干预,极大地提升了日常运营的效率。目前,在金融、保险、制造等传统行业,流程自动化型Agent占据了企业应用的主导地位。

2、超级Agent型

与流程自动化型Agent不同,超级智能体型Agent更侧重于探索和目标达成。它们被赋予一个高层次的目标,然后由智能体自主规划、探索信息、调用工具,并迭代优化路径以实现该目标。这类Agent更强调灵活性和解决复杂、非结构化问题的能力。

常见的应用场景包括生成市场研报、进行复杂的数据分析、甚至辅助软件开发等,都属于超级智能体型Agent的应用范畴。它们需要更强的推理能力、更广阔的知识面以及更灵活的工具调用能力。尽管目前在企业中的应用尚处于辅助地位,但其发展潜力巨大,代表着Agent更高级的智能形态。


04

当前Agent的不足

Agent固然强大,但并非万能,当前仍存在一些显著的不足,主要包括以下三个方面:

1、错误复合效应

大模型在执行任务时,准确率永远不可能达到100%。哪怕单次调用的准确率高达95%,(已属相当不错的水平),但当一个复杂任务需要Agent连续调用20次时,最终成功率却会骤降至约36%(0.95的20次方)。这也意味着,在真实而复杂的业务场景中,Agent想要“一步到位”全自动完成任务的概率,要远比想象中低得多。

而真正可行的做法,是放弃对“完美全自动”的幻想,把任务拆解成一系列更小的步骤,逐步执行、逐步验证。这样一来,即便某个环节出错,也能单独回溯或重试,不会牵连整个流程,从而显著提升系统的稳定性和任务的整体成功率。

2、token成本指数级增长

当Agent与用户或系统进行多轮交互时,为了保证上下文连贯,往往需要在每次对话中携带大量历史内容。随着轮次增加,所需的Token数量会急剧上升,API调用成本也随之飙升,最终成为企业部署Agent的一大负担。

更高效的做法,是尽量采用无状态或弱状态的会话设计,减少不必要的上下文传递。在多轮对话中,只保留关键变量或必要信息,并通过记忆系统进行优化,而不是把所有历史记录一股脑塞给大模型。这样不仅能大幅降低Token消耗,也能让系统运行得更轻、更稳。

3、工具生态不足

不少人以为,Agent的核心在于AI本身,但现实中,真正由AI推理完成的部分往往不到30%,其余70%的工作都落在调用、集成和调试浏览器、搜索引擎、编程接口、RPA(机器人流程自动化)等外部工具上。由于当前工具生态还不够成熟,很多时候Agent会陷入反复调试工具的困境,效率低下。

解决这一问题,首先要明确Agent可用的工具范围和使用规范,让它清楚“能用什么、该怎么用”。同时,还要设计完善的兜底机制,一旦工具调用失败或效果不佳,Agent能及时切换到备用方案,避免陷入无休止的重试循环。只有这样,Agent的稳定性和实用性才能真正提升。


05

企业Agent应用场景举例:价值重塑,

而非简单替代

Agent到底是否会导致90%的裁员?最终还是要看它在企业中能“做什么”和“替代什么”。下面列举两个真实使用场景,来具体说明这一点。

1. 语核科技AI数字员工:从“周”到“小时”的效率杠杆

语核科技是一家专注于企业级AI应用的科技公司,其核心是打造流程自动化型智能体,在业务层面精确瞄准了企业中“非标准化文档解析”和“海量物料匹配”这一业务瓶颈。为它的一个重工客户,成功解决了“非标维修清单和上万个物料SKU匹配”的头疼问题。使得这项工作的时间成本从原来的“一周以上”,大大压缩为“半小时以内”,同时还保持了高达90%以上的端到端准确率。为客户解决了发展中的一个耗时低效的业务阻塞点,释放出了大量的人力、物力和时间投入。

图片

2. 递航科技AI招聘官:将HR从“海量简历”中拯救出来

递航科技是一家专注于AI招聘领域的创新企业,致力于用智能Agent重塑传统招聘流程。在传统模式下,HR每天要筛上千份简历、发上百条信息,效率低、体验差。递航科技打造的数字员工团队,由多个具备不同职能的专业Agent协同工作(比如,AI“画像师”能精准构建人才模型,AI“寻访师”在全网高效锁定候选人,AI“沟通师”负责完成初步筛选与意向沟通),实现了招聘前端的自动化与智能化,同时也让招聘过程变得更快、更准,也更轻松。

image.png

说到这里,想必大家对“Agent上线是否会引发大规模裁员”这样的话题,已经有了更深的认识和更准确的判断。

AI Agent的核心价值在于自动化重复性任务,从而解放员工,使其能聚焦于更高价值的创新与决策。它带来的是企业岗位结构的优化和人才能力的升级,而非简单粗暴的取代。从某个角度看,Agent并不是职场中的“杀手”,而更像赋能企业与员工共同进化的加速器。战略性地理解并驾驭这项技术,才是我们在智能时代最该做的事,这远比“原地焦虑”有意义得多。

如何学习AGI大模型?

作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取

2025最新版CSDN大礼包:《AGI大模型学习资源包》免费分享**

一、2025最新大模型学习路线

一个明确的学习路线可以帮助新人了解从哪里开始,按照什么顺序学习,以及需要掌握哪些知识点。大模型领域涉及的知识点非常广泛,没有明确的学习路线可能会导致新人感到迷茫,不知道应该专注于哪些内容。

我们把学习路线分成L1到L4四个阶段,一步步带你从入门到进阶,从理论到实战。

L1级别:AI大模型时代的华丽登场

L1阶段:我们会去了解大模型的基础知识,以及大模型在各个行业的应用和分析;学习理解大模型的核心原理,关键技术,以及大模型应用场景;通过理论原理结合多个项目实战,从提示工程基础到提示工程进阶,掌握Prompt提示工程。

L2级别:AI大模型RAG应用开发工程

L2阶段是我们的AI大模型RAG应用开发工程,我们会去学习RAG检索增强生成:包括Naive RAG、Advanced-RAG以及RAG性能评估,还有GraphRAG在内的多个RAG热门项目的分析。

L3级别:大模型Agent应用架构进阶实践

L3阶段:大模型Agent应用架构进阶实现,我们会去学习LangChain、 LIamaIndex框架,也会学习到AutoGPT、 MetaGPT等多Agent系统,打造我们自己的Agent智能体;同时还可以学习到包括Coze、Dify在内的可视化工具的使用。

L4级别:大模型微调与私有化部署

L4阶段:大模型的微调和私有化部署,我们会更加深入的探讨Transformer架构,学习大模型的微调技术,利用DeepSpeed、Lamam Factory等工具快速进行模型微调;并通过Ollama、vLLM等推理部署框架,实现模型的快速部署。

整个大模型学习路线L1主要是对大模型的理论基础、生态以及提示词他的一个学习掌握;而L3 L4更多的是通过项目实战来掌握大模型的应用开发,针对以上大模型的学习路线我们也整理了对应的学习视频教程,和配套的学习资料。

二、大模型经典PDF书籍

书籍和学习文档资料是学习大模型过程中必不可少的,我们精选了一系列深入探讨大模型技术的书籍和学习文档,它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础(书籍含电子版PDF)

三、大模型视频教程

对于很多自学或者没有基础的同学来说,书籍这些纯文字类的学习教材会觉得比较晦涩难以理解,因此,我们提供了丰富的大模型视频教程,以动态、形象的方式展示技术概念,帮助你更快、更轻松地掌握核心知识

四、大模型项目实战

学以致用 ,当你的理论知识积累到一定程度,就需要通过项目实战,在实际操作中检验和巩固你所学到的知识,同时为你找工作和职业发展打下坚实的基础。

五、大模型面试题

面试不仅是技术的较量,更需要充分的准备。

在你已经掌握了大模型技术之后,就需要开始准备面试,我们将提供精心整理的大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。


因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取

2025最新版CSDN大礼包:《AGI大模型学习资源包》免费分享

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐