hello-agents第一章

2301_80044974

550人浏览 · 2026-02-14 19:48:34

2301_80044974 · 2026-02-14 19:48:34 发布

链接：hello-agents

声明：内容来自于Datawhale开源项目 hello-agents 和一些总结，仅自用

第一章初识智能体

1.1 什么是智能体？

在人工智能领域，智能体被定义为任何能够通过传感器（Sensors）感知其所处环境（Environment），并自主地通过执行器（Actuators）采取行动（Action）以达成特定目标的实体。

1.1.1 传统视角下的智能体

反射智能体（Simple Reflex Agent）

基于模型的反射智能体（Model-Based Reflex Agent）

决策不再仅仅依赖于瞬时感知，而是基于一个更连贯、更完整的世界状态理解

基于目标的智能体（Goal-Based Agent）

它的行为不再是被动地对环境做出反应，而是主动地、有预见性地选择能够导向某个特定未来状态的行动。例：GPS 导航系统

基于效用的智能体（Utility-Based Agent）

目标是最大化期望效用

学习型智能体（Learning Agent）

强化学习（Reinforcement Learning, RL）是实现这一思想最具代表性的路径

1.1.2 大语言模型驱动的新范式

传统智能体的能力源于工程师的显式编程与知识构建，其行为模式是确定且有边界的；而 LLM 智能体则通过在海量数据上的预训练，获得了隐式的世界模型与强大的涌现能力

1.1.3 智能体的类型

这里仅提一下基于知识表示的分类

符号主义 AI（Symbolic AI）

常被称为传统人工智能，其核心信念是：智能源于对符号的逻辑操作，符号是人类可读的实体（如词语、概念）

其主要优势在于透明和可解释。由于推理步骤明确，其决策过程可以被完整追溯

亚符号主义 AI（Sub-symbolic AI）

或称连接主义，知识并非显式的规则，而是内隐地分布在一个由大量神经元组成的复杂网络中，是从海量数据中学习到的统计模式。神经网络和深度学习是其代表。

通常被视为一个黑箱（Black Box），在纯粹的逻辑推理任务上表现不佳，有时会产生看似合理却事实错误的幻觉。

神经符号主义 AI（Neuro-Symbolic AI）

融合两大范式的优点，创造出一个既能像神经网络一样从数据中学习，又能像符号系统一样进行逻辑推理的混合智能体。大语言模型驱动的智能体是神经符号主义的一个范例

1.2 智能体的构成与运行原理

1.2.1 任务环境定义

在人工智能领域，通常使用PEAS 模型来精确描述一个任务环境，即分析其性能度量(Performance)、环境(Environment)、执行器(Actuators)和传感器(Sensors)

例如：

1.2.2 智能体的运行机制

智能体并非一次性完成任务，而是通过一个持续的循环与环境进行交互，这个核心机制被称为 智能体循环 (Agent Loop)

1. 感知 (Perception): 起点

2. 思考 (Thought)：核心决策阶段，分为：

规划 (Planning)：智能体基于当前的观察和其内部记忆，更新对任务和环境的理解，并制定或调整一个行动计划。
工具选择 (Tool Selection)

3. 行动 (Action)：决策完成后，智能体通过其执行器（Actuators）执行具体的行动。这通常表现为调用一个选定的工具（如代码解释器、搜索引擎 API），从而对环境施加影响，意图改变环境的状态。

行动并非循环的终点。智能体的行动会引起环境 (Environment) 的状态变化 (State Change)，环境随即会产生一个新的观察 (Observation) 作为结果反馈。这个新的观察又会在下一轮循环中被智能体的感知系统捕获，形成一个持续的“感知-思考-行动-观察”的闭环。

1.2.3 智能体的感知与行动

Thought-Action-Observation 交互范式

为了让 LLM 能够有效驱动这个循环，我们需要一套明确的交互协议 (Interaction Protocol) 来规范其与环境之间的信息交换，即智能体的输出是一段遵循特定格式的文本，其中明确地展示了其内部的推理过程与最终决策。

这个结构通常包含两个核心部分：

Thought (思考)：这是智能体内部决策的“快照”。它以自然语言形式阐述了智能体如何分析当前情境、回顾上一步的观察结果、进行自我反思与问题分解，并最终规划出下一步的具体行动。
Action (行动)：这是智能体基于思考后，决定对环境施加的具体操作，通常以函数调用的形式表示。

Thought: 用户想知道北京的天气。我需要调用天气查询工具。
Action: get_weather("北京")

行动执行后，环境会返回一个结果。例如，get_weather函数可能返回一个包含详细天气数据的 JSON 对象。

感知系统的一个重要职责就是扮演传感器的角色：将这个原始输出处理并封装成一段简洁、清晰的自然语言文本，即观察observation。

Observation: 北京当前天气为晴，气温25摄氏度，微风。

这段Observation文本会被反馈给智能体，作为下一轮循环的主要输入信息，供其进行新一轮的Thought和Action。

1.3 动手体验：5 分钟实现第一个智能体

过程见社区

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

UniMedVL：统一的医疗多模态理解和生成模型

2048 AI社区

2026 年 3 月 GEO 服务商 TOP5 权威榜单｜AI 流量增长核心选型指南

在众多服务商中，谁能在技术壁垒、行业适配与长期服务能力上构建真正的护城河，谁就能成为品牌决胜AI生态的关键伙伴。小叮文化是GEO领域深耕金融行业的标杆企业，核心技术优势集中在自主研发的金融关键词语义网络分析系统，该系统能深度解析金融行业专业术语、用户搜索意图及AI平台推荐逻辑，构建覆盖信贷、保险、理财等细分领域的语义关联网络，精准识别高价值关键词与潜在用户需求，解决传统优化中“金融术语适配难、用户