大模型知识之Agent

本文介绍了大模型知识的“Agent”

空城雀

906人浏览 · 2025-12-31 15:45:40

空城雀 · 2025-12-31 15:45:40 发布

文章目录

一、原理基础-何为Agent
- 一句话解释
- 和大模型的关系
二、Agent的组成部分
三、实际看看
- 如果你告诉大模型帮我自动每周写周报，**大模型会这样反应**：
- 但如果你有个写周报的agent，**agent会这样反应：**

上一轮工业革命已成历史，这一轮智能革命正在眼前。
我们正见证历史，关注我，一起学习大模型。

一、原理基础-何为Agent

一句话解释

Agent，翻译为“智能体”，是大模型应用的高级形态，它让 LLM 具备了主动规划、记忆、工具使用和行动执行的能力，而不仅仅是简单的问答。
讲人话，大模型只会告诉你怎么做，但agent不仅会告诉你怎么做，它还会给你做出来。

和大模型的关系

Agent ≠ 大模型，而是大模型的「应用形态」
大模型 ≈ 大脑
Agent ≈ 大脑 + 手脚 + 记忆系统 + 决策流程

也可以理解成，大模型只是Agent中的一环，如下图，
┌─────────────────────────────────────────┐
│ Agent 系统 │
│ │
│ ┌─────────┐ ┌─────────┐ ┌─────────┐ │
│ │ 规划器 │ │ 记忆系统 │ │ 执行器 │ │
│ └─────────┘ └─────────┘ └─────────┘ │
│ │ │ │ │
│ └─────┬─────┴─────┬─────┘ │
│ │ │ │
│ ┌───▼───────────▼───┐ │
│ │ 大模型 (LLM) │ │
│ │ （思考核心） │ │
│ └───────────── ──────┘ │
│ │
│ ┌───────────────────────────────────┐ │
│ │ 工具集合 │ │
│ │ • 搜索 • 计算 • 代码执行 │ │
│ │ • API • 文件操作 • 数据库 │ │
│ └───────────────────────────────────┘ │
└─────────────────────────────────────────┘

二、Agent的组成部分

一、四大基础组件（必选）

思考引擎
核心：大模型（LLM）
功能：理解、推理、决策、规划
例子：GPT-4、Qwen
记忆系统
短期记忆：当前会话上下文
长期记忆：历史经验知识库
向量存储：快速检索相似信息
外部知识库：文档、数据库。这是企业中很重要的部分
工具集
信息获取：搜索、API调用、爬虫
操作执行：文件操作、代码执行、系统调用
计算分析：计算器、数据处理、图表生成
通信交互：邮件、消息、通知
比如说调用一个开源的天气接口。
执行器
任务分解：拆解复杂任务
动作调度：协调工具调用
状态管理：跟踪任务进度
异常处理：应对执行失败

简单的agent就这样了，也够用了，复杂的还会包含其他的，这里我们不介绍。

三、实际看看

其实理解起来是有点模糊的，来加深下印象
一个完整的「自动写周报」Agent：

如果你告诉大模型帮我自动每周写周报，大模型会这样反应：

用户：帮我写这周的工作周报

大模型：我可以帮你写周报模板。
请告诉我：
1. 你这周具体做了什么？
2. 遇到了什么问题？
3. 下周计划是什么？
4. 需要什么格式？

用户：我不知道具体做了什么，你自己查一下

大模型：抱歉，我无法访问你的工作记录，
我只能基于你提供的信息写报告。

他只会和你对话，但它不能自动获取你和周报相关的信息。

但如果你有个写周报的agent，agent会这样反应：

理解用户需求
user_input = “帮我写这周的工作周报”
大模型分析：这不是简单问答，需要多个步骤
记忆系统
三种记忆同时工作
memories = {
“短期记忆”: “用户刚才说要写周报”,
“长期记忆”: “该用户是后端开发，周报格式要求包含：进度、问题、下周计划”,
“上周记忆”: “上周完成了用户登录模块，这周应该继续”
}
这些数据是哪来的呢，是你以前和他说话的时候，他记住的
调用工具
比如
tools = {
“读取日程”: read_calendar(), # 从Outlook读会议
“读取代码提交”: read_git_log(), # 从Git读提交记录
“读取任务系统”: read_jira(), # 从Jira读任务状态
“读取聊天记录”: read_slack(), # 从Slack读讨论
“生成文档”: generate_doc(), # 生成Word文档
“发送邮件”: send_email() # 发送给领导
}
这些方法是哪来的，其实就是接口，你写的或者你同事写的或者开源的
后面就是写周报的一些后续操作，比如查到资料后整理成报告，每周定时发出等等。

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

医疗模型Hyperopt调参稳住AUC

2048 AI社区

Java 后端如何高效对接 Python 微调大模型？四种数据交互方案全解析（含实战代码）

Python 微调大模型可通过 Flask/FastAPI 暴露 REST 接口，Java 使用 Spring 的或调用。Python 示例（FastAPI）：https://www.zhihu.com/zvideo/1993874870761722160/https://www.zhihu.com/zvideo/1993874870648451336/https://www.zhihu.com/

2048 AI社区

AI的平衡艺术：2026年如何在技术狂奔中守护人性价值

2026年AI发展进入精智落地新阶段，战略核心从"盲目追新"转向"平衡艺术"。本文深入探讨技术与人性、创新与治理、自动化与体验三大平衡维度，通过真实场景分析展示如何构建可持续的AI价值体系。文章为企业和技术开发者提供兼具前瞻性与实操性的实施框架，助力在AI浪潮中把握发展节奏。关键词AI战略、技术伦理、人机协同、AI治理、用户体验、可持续创新