链接:hello-agents

声明:内容来自于Datawhale开源项目 hello-agents 和一些总结,仅自用

第一章 初识智能体

1.1 什么是智能体?

在人工智能领域,智能体被定义为任何能够通过传感器(Sensors)感知其所处环境(Environment),并自主地通过执行器(Actuators)采取行动(Action)以达成特定目标的实体。

1.1.1 传统视角下的智能体

反射智能体(Simple Reflex Agent)

基于模型的反射智能体(Model-Based Reflex Agent)

        决策不再仅仅依赖于瞬时感知,而是基于一个更连贯、更完整的世界状态理解

基于目标的智能体(Goal-Based Agent)

        它的行为不再是被动地对环境做出反应,而是主动地、有预见性地选择能够导向某个特定未来状态的行动。 例:GPS 导航系统

基于效用的智能体(Utility-Based Agent)

        目标是最大化期望效用        

学习型智能体(Learning Agent)

        强化学习(Reinforcement Learning, RL)是实现这一思想最具代表性的路径

1.1.2 大语言模型驱动的新范式

        传统智能体的能力源于工程师的显式编程与知识构建,其行为模式是确定且有边界的;而 LLM 智能体则通过在海量数据上的预训练,获得了隐式的世界模型与强大的涌现能力

1.1.3 智能体的类型

这里仅提一下基于知识表示的分类

  • 符号主义 AI(Symbolic AI)

        常被称为传统人工智能,其核心信念是:智能源于对符号的逻辑操作,符号是人类可读的实体(如词语、概念)

        其主要优势在于透明和可解释。由于推理步骤明确,其决策过程可以被完整追溯

  • 亚符号主义 AI(Sub-symbolic AI)

        或称连接主义,知识并非显式的规则,而是内隐地分布在一个由大量神经元组成的复杂网络中,是从海量数据中学习到的统计模式。神经网络和深度学习是其代表。

        通常被视为一个黑箱(Black Box),在纯粹的逻辑推理任务上表现不佳,有时会产生看似合理却事实错误的幻觉 。

  • 神经符号主义 AI(Neuro-Symbolic AI)

        融合两大范式的优点,创造出一个既能像神经网络一样从数据中学习,又能像符号系统一样进行逻辑推理的混合智能体。大语言模型驱动的智能体是神经符号主义的一个范例

        

1.2 智能体的构成与运行原理

1.2.1 任务环境定义

在人工智能领域,通常使用PEAS 模型来精确描述一个任务环境,即分析其性能度量(Performance)、环境(Environment)、执行器(Actuators)和传感器(Sensors) 

例如:

1.2.2 智能体的运行机制

        智能体并非一次性完成任务,而是通过一个持续的循环与环境进行交互,这个核心机制被称为 智能体循环 (Agent Loop)

1. 感知 (Perception):   起点

2. 思考 (Thought):核心决策阶段,分为:

  • 规划 (Planning):智能体基于当前的观察和其内部记忆,更新对任务和环境的理解,并制定或调整一个行动计划。
  • 工具选择 (Tool Selection)

3. 行动 (Action):决策完成后,智能体通过其执行器(Actuators)执行具体的行动。这通常表现为调用一个选定的工具(如代码解释器、搜索引擎 API),从而对环境施加影响,意图改变环境的状态。

        行动并非循环的终点。智能体的行动会引起环境 (Environment) 的状态变化 (State Change),环境随即会产生一个新的观察 (Observation) 作为结果反馈。这个新的观察又会在下一轮循环中被智能体的感知系统捕获,形成一个持续的“感知-思考-行动-观察”的闭环。

1.2.3 智能体的感知与行动

Thought-Action-Observation 交互范式

        为了让 LLM 能够有效驱动这个循环,我们需要一套明确的交互协议 (Interaction Protocol) 来规范其与环境之间的信息交换,即智能体的输出是一段遵循特定格式的文本,其中明确地展示了其内部的推理过程与最终决策。

这个结构通常包含两个核心部分:

  • Thought (思考):这是智能体内部决策的“快照”。它以自然语言形式阐述了智能体如何分析当前情境、回顾上一步的观察结果、进行自我反思与问题分解,并最终规划出下一步的具体行动。
  • Action (行动):这是智能体基于思考后,决定对环境施加的具体操作,通常以函数调用的形式表示。
Thought: 用户想知道北京的天气。我需要调用天气查询工具。
Action: get_weather("北京")

        行动执行后,环境会返回一个结果。例如,get_weather函数可能返回一个包含详细天气数据的 JSON 对象。

        感知系统的一个重要职责就是扮演传感器的角色:将这个原始输出处理并封装成一段简洁、清晰的自然语言文本,即观察observation。

Observation: 北京当前天气为晴,气温25摄氏度,微风。

这段Observation文本会被反馈给智能体,作为下一轮循环的主要输入信息,供其进行新一轮的ThoughtAction

1.3 动手体验:5 分钟实现第一个智能体

        过程见社区

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐