上一轮工业革命已成历史,这一轮智能革命正在眼前。
我们正见证历史,关注我,一起学习大模型。

一、原理基础-何为Agent

一句话解释

Agent,翻译为“智能体”,是大模型应用的高级形态,它让 LLM 具备了主动规划、记忆、工具使用和行动执行的能力,而不仅仅是简单的问答。
讲人话,大模型只会告诉你怎么做,但agent不仅会告诉你怎么做,它还会给你做出来。

和大模型的关系

Agent ≠ 大模型,而是大模型的「应用形态」
大模型 ≈ 大脑
Agent ≈ 大脑 + 手脚 + 记忆系统 + 决策流程

也可以理解成,大模型只是Agent中的一环,如下图,
┌─────────────────────────────────────────┐
│ Agent 系统 │
│ │
│ ┌─────────┐ ┌─────────┐ ┌─────────┐ │
│ │ 规划器 │ │ 记忆系统 │ │ 执行器 │ │
│ └─────────┘ └─────────┘ └─────────┘ │
│ │ │ │ │
│ └─────┬─────┴─────┬─────┘ │
│ │ │ │
│ ┌───▼───────────▼───┐ │
│ │ 大模型 (LLM) │ │
│ │ (思考核心) │ │
│ └───────────── ──────┘ │
│ │
│ ┌───────────────────────────────────┐ │
│ │ 工具集合 │ │
│ │ • 搜索 • 计算 • 代码执行 │ │
│ │ • API • 文件操作 • 数据库 │ │
│ └───────────────────────────────────┘ │
└─────────────────────────────────────────┘

二、Agent的组成部分

一、四大基础组件(必选)

  1. 思考引擎
    核心:大模型(LLM)
    功能:理解、推理、决策、规划
    例子:GPT-4、Qwen

  2. 记忆系统
    短期记忆:当前会话上下文
    长期记忆:历史经验知识库
    向量存储:快速检索相似信息
    外部知识库:文档、数据库。这是企业中很重要的部分

  3. 工具集
    信息获取:搜索、API调用、爬虫
    操作执行:文件操作、代码执行、系统调用
    计算分析:计算器、数据处理、图表生成
    通信交互:邮件、消息、通知
    比如说调用一个开源的天气接口。

  4. 执行器
    任务分解:拆解复杂任务
    动作调度:协调工具调用
    状态管理:跟踪任务进度
    异常处理:应对执行失败

简单的agent就这样了,也够用了,复杂的还会包含其他的,这里我们不介绍。

三、实际看看

其实理解起来是有点模糊的,来加深下印象
一个完整的「自动写周报」Agent:

如果你告诉大模型帮我自动每周写周报,大模型会这样反应

用户:帮我写这周的工作周报

大模型:我可以帮你写周报模板。
请告诉我:
1. 你这周具体做了什么?
2. 遇到了什么问题?
3. 下周计划是什么?
4. 需要什么格式?

用户:我不知道具体做了什么,你自己查一下

大模型:抱歉,我无法访问你的工作记录,
我只能基于你提供的信息写报告。

他只会和你对话,但它不能自动获取你和周报相关的信息。

但如果你有个写周报的agent,agent会这样反应:

  1. 理解用户需求
    user_input = “帮我写这周的工作周报”
    大模型分析:这不是简单问答,需要多个步骤
  2. 记忆系统
    三种记忆同时工作
    memories = {
    “短期记忆”: “用户刚才说要写周报”,
    “长期记忆”: “该用户是后端开发,周报格式要求包含:进度、问题、下周计划”,
    “上周记忆”: “上周完成了用户登录模块,这周应该继续”
    }
    这些数据是哪来的呢,是你以前和他说话的时候,他记住的
  3. 调用工具
    比如
    tools = {
    “读取日程”: read_calendar(), # 从Outlook读会议
    “读取代码提交”: read_git_log(), # 从Git读提交记录
    “读取任务系统”: read_jira(), # 从Jira读任务状态
    “读取聊天记录”: read_slack(), # 从Slack读讨论
    “生成文档”: generate_doc(), # 生成Word文档
    “发送邮件”: send_email() # 发送给领导
    }
    这些方法是哪来的,其实就是接口,你写的或者你同事写的或者开源的
  4. 后面就是写周报的一些后续操作,比如查到资料后整理成报告,每周定时发出等等。
Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐