理解AI Agent

yjy811003

774人浏览 · 2025-10-23 22:30:59

yjy811003 · 2025-10-23 22:30:59 发布

强化学习(RL):

在谈Agent之前先说说强化学习(RL)的要点:(我总结出与Agent相关的三个要点)

1.强化学习是机器学习的一种,其核心是"让智能体通过与环境交互,学习到最大化累计奖励的决策策略".

2.强化学习逻辑是"智能体在环境中,执行动作后,环境返回奖励,智能体通过不断调整策略,最终学会不同状态下选择能获得最高长期奖励的动作".

3.强化学习是Agent实现"自主学习"的核心技术之一.

Agent:

Agent是"能与环境交互的自主实体",能够通过传感器感知环境,通过决策生成动作,作用于环境,实现最终目标的实体.

Agent是"主体",强化学习是"工具"

AI Agent ( Artificial Intelligence Agent ):

AI Agent即是Agent在人工智能领域的一种能够感知环境,进行自主理解,进行决策和执行动作的智能实体.不同于传统的人工智能,AI Agent能够独立思考,调用工具去逐步完成给定目标的能力.其可以是物理实体( 机器人 )也可以是虚拟实体( 软件程序 )

AI Agent是基于GPT-4 的 AutoGPT(2023年3月)、 BabyGPT(同年4月)、GPT-Engineer (同年5月)等开源 Agent 程序开始的.

AI Agent主要类别:

Agent根据感知的智能和能力程度不同,分为以下几类:

1. 简单反射型:

根据当前环境状态直接做出反应,完全基于"条件-行动"规则.感知到特定情况就会立即做出反应,不考虑历史信息.如: 简单的温度调节器,根据环境温度加热制冷.

2. 目标导向型:

根据预设目标来做决策,能规划和执行序列动作达成目标,不仅仅能感知当前状态,还拥有明确"目标",所有行动都服务于"如何达到目标",会进行搜索和规划.如: 自动驾驶汽车.

3. 学习型:

能基于过去的经验和数据进行学习,不断优化自身性能,有一个"学习元件",可根据行动后的反馈来修改决策机制.如: 基于用户反馈不断优化的聊天机器人.

AI Agent原理(LLM Agent):

定义:AI Agent = LLM(大脑) + 记忆 + 任务规划 + 工具使用 + 行动

原理图:

工作流程:

1-Prompt提示词: Agent接收的初始输入,描述了Agent需哟完成的任务.

2-LLM大模型: 大模型是Agent进行规划和推理的重要工具.利用大模型对提示词进行分析,生成可能的解决方案

3-Memory记忆: 保留用户输入以及上下文,外部向量存储的知识库,网页信息等.方便与用户更好的沟通,更好的理解用户需求.

4-Planning规划: 任务规划是根据大模型,提示词,知识库进行规划和决策的过程.其涉及对任务的分解,目标的设定,路径的规划等.

5-Action行动: Agent根据任务规划结果执行具体操作.工具:计算器,代码编辑器,搜索,API等.

6-Environment环境: 不是工作流程的一部分,但是是Agent所处的场景,可以是现实,也可是是虚拟环境,是Agent交互的对象.

工作原理示例图:

AI Agent的开发工具:

字节:coze扣子 (个人学习推荐,简单好用)

百度:AgentBuiler

LangChain/Langgraph,AgentGPT等

个人看法:

AI Agent应用广泛且可以极大减轻企业或个人的时间和人力成本,提高工作效率.理论上 AI Agent架构能解决无限域的问题,潜力极大.

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

一条停水通知花了几小时，AI 员工能不能把它压缩到几秒？

2048 AI社区

Docker学习笔记--作用，安装，Dockerfile，运行，DockerCompose，停止服务，删除，常用指令和使用 Portainer 管理

2048 AI社区

巧用 AI 导出鸭，搞定 Gemini 输出 excel 各类导出难题

2048 AI社区

所有评论(0)

查看更多评论

yjy811003

@yjy811003

已为社区贡献1条内容

理解AI Agent

yjy811003

强化学习(RL):

Agent:

AI Agent主要类别:

AI Agent原理(LLM Agent):

AI Agent的开发工具:

所有评论(0)

温馨提示：您尚未绑定手机号

yjy811003