大模型知识之Agent
本文介绍了大模型知识的“Agent”
文章目录
上一轮工业革命已成历史,这一轮智能革命正在眼前。
我们正见证历史,关注我,一起学习大模型。
一、原理基础-何为Agent
一句话解释
Agent,翻译为“智能体”,是大模型应用的高级形态,它让 LLM 具备了主动规划、记忆、工具使用和行动执行的能力,而不仅仅是简单的问答。
讲人话,大模型只会告诉你怎么做,但agent不仅会告诉你怎么做,它还会给你做出来。
和大模型的关系
Agent ≠ 大模型,而是大模型的「应用形态」
大模型 ≈ 大脑
Agent ≈ 大脑 + 手脚 + 记忆系统 + 决策流程
也可以理解成,大模型只是Agent中的一环,如下图,
┌─────────────────────────────────────────┐
│ Agent 系统 │
│ │
│ ┌─────────┐ ┌─────────┐ ┌─────────┐ │
│ │ 规划器 │ │ 记忆系统 │ │ 执行器 │ │
│ └─────────┘ └─────────┘ └─────────┘ │
│ │ │ │ │
│ └─────┬─────┴─────┬─────┘ │
│ │ │ │
│ ┌───▼───────────▼───┐ │
│ │ 大模型 (LLM) │ │
│ │ (思考核心) │ │
│ └───────────── ──────┘ │
│ │
│ ┌───────────────────────────────────┐ │
│ │ 工具集合 │ │
│ │ • 搜索 • 计算 • 代码执行 │ │
│ │ • API • 文件操作 • 数据库 │ │
│ └───────────────────────────────────┘ │
└─────────────────────────────────────────┘
二、Agent的组成部分
一、四大基础组件(必选)
-
思考引擎
核心:大模型(LLM)
功能:理解、推理、决策、规划
例子:GPT-4、Qwen -
记忆系统
短期记忆:当前会话上下文
长期记忆:历史经验知识库
向量存储:快速检索相似信息
外部知识库:文档、数据库。这是企业中很重要的部分 -
工具集
信息获取:搜索、API调用、爬虫
操作执行:文件操作、代码执行、系统调用
计算分析:计算器、数据处理、图表生成
通信交互:邮件、消息、通知
比如说调用一个开源的天气接口。 -
执行器
任务分解:拆解复杂任务
动作调度:协调工具调用
状态管理:跟踪任务进度
异常处理:应对执行失败
简单的agent就这样了,也够用了,复杂的还会包含其他的,这里我们不介绍。
三、实际看看
其实理解起来是有点模糊的,来加深下印象
一个完整的「自动写周报」Agent:
如果你告诉大模型帮我自动每周写周报,大模型会这样反应:
用户:帮我写这周的工作周报
大模型:我可以帮你写周报模板。
请告诉我:
1. 你这周具体做了什么?
2. 遇到了什么问题?
3. 下周计划是什么?
4. 需要什么格式?
用户:我不知道具体做了什么,你自己查一下
大模型:抱歉,我无法访问你的工作记录,
我只能基于你提供的信息写报告。
他只会和你对话,但它不能自动获取你和周报相关的信息。
但如果你有个写周报的agent,agent会这样反应:
- 理解用户需求
user_input = “帮我写这周的工作周报”
大模型分析:这不是简单问答,需要多个步骤 - 记忆系统
三种记忆同时工作
memories = {
“短期记忆”: “用户刚才说要写周报”,
“长期记忆”: “该用户是后端开发,周报格式要求包含:进度、问题、下周计划”,
“上周记忆”: “上周完成了用户登录模块,这周应该继续”
}
这些数据是哪来的呢,是你以前和他说话的时候,他记住的 - 调用工具
比如
tools = {
“读取日程”: read_calendar(), # 从Outlook读会议
“读取代码提交”: read_git_log(), # 从Git读提交记录
“读取任务系统”: read_jira(), # 从Jira读任务状态
“读取聊天记录”: read_slack(), # 从Slack读讨论
“生成文档”: generate_doc(), # 生成Word文档
“发送邮件”: send_email() # 发送给领导
}
这些方法是哪来的,其实就是接口,你写的或者你同事写的或者开源的 - 后面就是写周报的一些后续操作,比如查到资料后整理成报告,每周定时发出等等。
更多推荐

所有评论(0)