初识智能体
智能体是通过传感器感知环境并通过执行器采取行动的自主实体。它能分解目标为子任务(如出行规划),调用外部工具(如天气查询)补全信息,并根据用户反馈动态调整计划(如酒店预算)。智能体结合了快速直觉(系统1)与逻辑推理(系统2)的思维方式,神经符号主义使其兼具模式识别与结构化推理能力。其运作遵循感知-思考-行动循环:通过传感器接收输入,进行规划与工具选择,再执行具体行动。智能体框架常采用结构化交互协议,
智能体被定义为任何能够通过传感器(Sensors)感知其所处环境(Environment),并自主地通过执行器(Actuators)采取行动(Action)以达成特定目标的实体。


-
规划与推理:智能体首先会将这个高层级目标分解为一系列逻辑子任务,例如:
[确认出行偏好] -> [查询目的地信息] -> [制定行程草案] -> [预订票务住宿]。这是一个内在的、由模型驱动的规划过程。 -
工具使用:在执行规划时,智能体识别到信息缺口,会主动调用外部工具来补全。例如,它会调用天气查询接口获取实时天气,并基于“预报有雨”这一信息,在后续规划中倾向于推荐室内活动。
-
动态修正:在交互过程中,智能体会将用户的反馈(如“这家酒店超出预算”)视为新的约束,并据此调整后续的行动,重新搜索并推荐符合新要求的选项。整个“查天气 → 调行程 → 订酒店”的流程,展现了其根据上下文动态修正自身行为的能力。

-
系统 1是快速、凭直觉、并行的思维模式,类似于亚符号主义 AI 强大的模式识别能力。
-
系统 2是缓慢、有条理、基于逻辑的审慎思维,恰如符号主义 AI 的推理过程。

人类的智能,正源于这两个系统的协同工作。同样,一个真正鲁棒的 AI,也需要兼具二者之长。大语言模型驱动的智能体是神经符号主义的一个极佳实践范例。其内核是一个巨大的神经网络,使其具备模式识别和语言生成能力。然而,当它工作时,它会生成一系列结构化的中间步骤,如思想、计划或 API 调用,这些都是明确的、可操作的符号。通过这种方式,它实现了感知与认知、直觉与理性的初步融合。

要理解智能体的运作,我们必须先理解它所处的任务环境。在人工智能领域,通常使用PEAS 模型来精确描述一个任务环境,即分析其性能度量(Performance)、环境(Environment)、执行器(Actuators)和传感器(Sensors) 。
智能体运行机制

-
感知 (Perception):这是循环的起点。智能体通过其传感器(例如,API 的监听端口、用户输入接口)接收来自环境的输入信息。这些信息,即观察 (Observation),既可以是用户的初始指令,也可以是上一步行动所导致的环境状态变化反馈。
-
思考 (Thought)
:接收到观察信息后,智能体进入其核心决策阶段。对于 LLM 智能体而言,这通常是由大语言模型驱动的内部推理过程。如图所示,“思考”阶段可进一步细分为两个关键环节:
-
规划 (Planning):智能体基于当前的观察和其内部记忆,更新对任务和环境的理解,并制定或调整一个行动计划。这可能涉及将复杂目标分解为一系列更具体的子任务。
-
工具选择 (Tool Selection):根据当前计划,智能体从其可用的工具库中,选择最适合执行下一步骤的工具,并确定调用该工具所需的具体参数。
-
-
行动 (Action):决策完成后,智能体通过其执行器(Actuators)执行具体的行动。这通常表现为调用一个选定的工具(如代码解释器、搜索引擎 API),从而对环境施加影响,意图改变环境的状态。
交互协议 (Interaction Protocol) 在许多现代智能体框架中,这一协议体现在对智能体每一次输出的结构化定义上。这个结构通常包含两个核心部分:
-
Thought (思考):这是智能体内部决策的“快照”。它以自然语言形式阐述了智能体如何分析当前情境、回顾上一步的观察结果、进行自我反思与问题分解,并最终规划出下一步的具体行动。
-
Action (行动):这是智能体基于思考后,决定对环境施加的具体操作,通常以函数调用的形式表示。

Workflow 是让 AI 按部就班地执行指令,而 Agent 则是赋予 AI 自由度去自主达成目标。
工作流是一种传统的自动化范式,其核心是对一系列任务或步骤进行预先定义的、结构化的编排。
基于大型语言模型的智能体是一个具备自主性的、以目标为导向的系统。
这种基于实时信息进行动态推理和决策的能力,正是 Agent 的核心价值所在。
-
智能体有哪些主流的应用范式? 最后,我们将视野投向了更广阔的应用领域。我们探讨了两种主流的智能体交互模式:一是以 GitHub Copilot 和 Cursor 等为代表的、增强人类工作流的“开发者工具”;二是以 CrewAI、MetaGPT 和 AgentScope 等框架为代表的、能够独立完成高层级目标的“自主协作者”。同时讲解了 Workflow 与 Agent 的差异。
更多推荐


所有评论(0)