01 现状观察:技术落地到哪一步了?

我感觉此刻 Agent 技术处在一个微妙的位置:

好消息是,类似 Cursor、Youmind 和 Lovart 这样的 Agent 工具真的能用了,能用指的是愿意让大家持续性地为其功能按月付费,即代表他们的能力已经能对工作产生稳定价值。

有趣的现象是,好像大家对上半年"假 Agent"的感知比较强,然后那会儿 Agent 能力跟不上,骂声一片,现在 Agent 真的有能力了之后,大家又不怎么讲 Agent 了。

新的挑战变了。架构层面的问题基本有答案了,反而现在最难的是: 怎么把人脑里的业务知识,转化成 Agent 能理解的形式? 这需要既懂技术又懂业务的人来做,短期内 AI 还替代不了这个环节。

02 拆解 Deep Agent:到底"Deep"在哪里?

我觉得有两个判断标准。

标准一:专业到让人分不出真假

举个例子。假设我需要一个 SEO 内容优化 Agent,给它一个关键词或者网页 URL,让它输出优化建议报告。什么叫做得好?就是这份报告拿给网站运营团队看,团队根本看不出来是 AI 写的,会以为是资深 SEO 专家写的——关键词密度分析、内链结构建议、元标签优化方案,该有的都有,逻辑还很清晰。更关键的是,按照它的建议实施后,页面在检测工具的检测下,或者在 1-2 周内真的有数据变化了。

再比如竞品分析 Agent。我给它一个目标关键词,它要能分析排名前 10 的竞品页面,找出它们的内容策略、外链模式、页面结构特点,还要给出可操作的优化建议。怎么验证做得好?拿它的分析结果跟 SEO 老手手工分析的对比,关键发现的重合度要超过 70%,给出的策略方向也要一致。

这种"专业深度"背后,其实依赖三种东西:

  • SEO 老手总结出来的优化方法论和排名因素权重

  • 大量真实案例的积累(成功提升排名的和失败的都要)

  • 搜索引擎算法更新的经验和行业默契(这个最难获取)

标准二:能持续干活不掉链子

  • 稳定性够硬: 连续跑几个小时、几十个小时都不会崩溃

  • 能处理复杂流程: 几十上百个步骤的任务链,涉及大量 API 调用,也能顺利完成

  • 记忆够长: 记忆是能持续工作的基础。以 SEO 为例,这类工作非常注重延续性和节奏,如果每次都需要打开新窗口,或者任务动不动就挂掉需要用户重新开始,基本等于让用户放弃使用

03 Agent 和 Workflow 有啥本质区别?

它们其实是一回事 ,只是把复杂度放在了不同的地方:

Workflow 是把业务逻辑画成流程图,每个节点、每条边界都被定义清楚

Agent 是把这些逻辑写成自然语言的 Prompt,让模型自己去理解和执行

表面上看 Agent 的架构更简洁(就是 Prompt + Tool),但其实只是把"设计流程图"的工作,换成了"设计 Prompt" 而已。

复杂度没消失,只是转移了。

04 怎么做出能用的 Deep Agent?

痛点一:怎么让 Agent 真正理解业务?

之前比较常见的是如下两个方法:

方法一:拼命写 Prompt 把业务流程、注意事项、边界条件全写进 Prompt,结果 Prompt 越写越长,改起来又慢又容易出错。而且写死的流程,遇到新情况就不灵了。

方法二:搭 RAG 系统 理论上可以解决知识量的问题,但实际操作太麻烦了:要建索引、做向量化、切分文档、调优检索……对于想快速验证想法的场景来说,门槛较高。

此处强烈建议大家去看看 Agent Skills 这个概念。这是 Anthropic 今年 10 月提出的,此刻已经 12 月了,其实也不算新东西了。

Skills 的巧妙设计:像翻书一样使用知识

Skills 的核心思路特别简单: 把知识组织成一个文件夹,Agent 需要什么就去"翻"什么 。

具体来说:

  • 每个 Skill 就是一个文件夹

  • 文件夹里有个 SKILL.md 文件,开头用 YAML 格式写明这个 Skill 的名字和简介

  • Agent 启动时,会把所有 Skill 的名字和简介加载进来(就像书的目录)

  • 执行任务时,如果 Agent 觉得某个 Skill 可能有用,就会去读完整的 SKILL.md

  • 如果 SKILL.md 里还引用了其他文件(比如详细的操作手册),Agent 会在需要时才去读

这个设计让我想起翻工具书:不用一开始就把整本书背下来,而是先看目录,需要时再翻到具体章节。

举个例子。假设有个处理 PDF 的 Skill:

  • Agent 启动时知道有个 “PDF Skill”,能处理 PDF 相关任务

  • 用户要填 PDF 表单时,Agent 会读取 SKILL.md 的完整内容

  • 发现需要查表单填写规范时,再去读 forms.md 这个参考文件

Skills 里还能放代码 。比如 PDF Skill 里有个 Python 脚本,专门用来提取 PDF 表单字段。Agent 可以直接运行这个脚本,既不占用上下文空间,又能保证结果的稳定性(代码是确定性的,不会"幻觉")。

Skills 解决了什么问题?

好处一:上下文不会爆炸 按需加载,用多少加载多少,上下文管理轻松多了。

好处二:强迫我梳理业务 写 Skills 的过程,其实就是在理清业务逻辑:什么是核心流程?什么是辅助信息?什么情况下需要什么知识?这个梳理过程也是个认知提升的过程。

好处三:特别好分享 当同事问"你那个 Agent 怎么做的",可以直接把 Skills 文件夹发给他,他照着改改就能用。比维护一个复杂的代码库简单太多了。

好处四:降低了工具调用的混乱度 以前一次性注册 20 个工具模型都会搞混。现在工具也做成 Skills,需要什么加载什么,调用准确率明显提升。

但也不是完美的

理想很美好,现实有点骨感。我在测试中发现:

Skills 这套玩法对模型能力有要求 ,只有 SOTA 系列模型能做到接近理想的效果。

痛点二:怎么让 Agent 持续稳定地干活?

LangGraph 总结了 4 个关键机制,我把它们理解成 Agent 的"四大支柱"。

支柱一:会做计划

Agent 需要"规划能力"是长任务的关键。

比如用户说"帮我研究一下 AI 芯片市场",这个任务太大了,Agent 得先拆解:

  1. 确定研究范围(哪些公司?哪些技术方向?)
  2. 收集资料(新闻、报告、专利……)
  3. 分析数据
  4. 撰写报告

LangGraph 提供了 write_todos 这样的工具,Agent 可以:

  • 把大任务拆成小步骤

  • 跟踪每一步的完成情况

  • 根据中间结果调整后续计划

这就像我们做项目时列待办清单,能帮助保持方向感。

支柱二:会分配任务(子 Agent)

刚接触子 Agent 这个概念时,我不太理解为什么要搞这么复杂。后来做了几个实验才明白: 子 Agent 是为了隔离和并行 。

想象这样一个场景:主 Agent 在分析市场报告,突然需要查一下某家公司的融资历史。如果主 Agent 自己去查,那分析报告的上下文里就会混入一堆融资数据,后面的推理就可能被干扰。

但如果派一个子 Agent 去查融资信息,它在自己的上下文里工作,查完把结果返回就行,主 Agent 的上下文保持干净。

另外,多个子 Agent 可以并行工作,大幅提升效率。比如同时让 3 个子 Agent 去查不同公司的信息,再把结果汇总。

子 Agent 还有个好处: 可以给它们配专属工具 。比如专门查专利的子 Agent,只需要加载专利检索工具,不用关心其他的。

支柱三:有自己的"硬盘"(文件系统)

这个我特别好理解,因为本质上就是给 Agent 配个存储空间。

Agent 可以用文件系统做三件事:

  1. 释放内存 当上下文快满的时候,Agent 可以把暂时不用的信息写到文件里,需要时再读回来。就像我们电脑内存不够用,会把一些程序最小化一样。
  2. 多 Agent 协作 文件系统是个共享空间,主 Agent 和子 Agent 都能访问。A 子 Agent 查到的资料写到文件里,B 子 Agent 可以直接读取,不用通过主 Agent 中转。
  3. 长期记忆 Agent 可以在文件里记笔记:哪些尝试失败了,哪些路径走通了,下次遇到类似问题可以参考。甚至可以把一些常用脚本存在文件系统里,需要时调用。

支柱四:超详细的系统提示

最好用的 Agent 往往有超级详细的系统提示,长达几千行都不夸张 。

Claude Deep Research 的系统提示词里面定义了:

  • 什么情况下应该停下来重新规划

  • 什么时候该创建子 Agent,什么时候自己处理

  • 每个工具的详细用法和注意事项

  • 文件命名规则、目录结构规范

可以说, 系统提示承载了整个应用的复杂度 。我们把流程、规则、最佳实践都写在这里,Agent 就知道该怎么干活了。

这四个支柱不是孤立的,它们相互配合才能让 Agent 稳定地执行复杂任务。而背后的核心技术,其实就是"上下文工程"——如何巧妙地利用有限的上下文窗口。

05 架构演进:我看到的趋势

从百花齐放到逐渐收敛

大家逐渐形成共识,都在往 Claude Agent SDK 和 LangGraph DeepAgent 的方向靠拢。

这种架构有几个共同特征:

  • 主从结构(一个主 Agent 调度,多个子 Agent 执行)

  • 内置规划能力

  • 独立的文件系统

  • 自动压缩上下文(Token 用到 80% 自动总结前文)

从通用到垂直:怎么适配具体业务?

方向一:业务知识 Skills 化 把公司的业务文档、操作手册、典型案例等,整理成 Skills 的形式,放进 Agent 的文件系统。Agent 会根据任务需要,动态加载相关知识。

方向二:业务接口 MCP 化 把公司内部的 API 封装成 MCP 服务。Agent 可以像连接外设一样,按需连接这些服务。

方向三:精细化系统提示 给主 Agent 和子 Agent 分别编写详细的系统提示,定义好:

  • 什么情况下该用什么工具

  • 遇到特定场景该怎么处理

  • 业务规则和边界条件是什么

06 展望:一些思考

Agent 技术的核心不是某个具体技术,而是一种思维方式的转变 ——从"写代码定义流程",到"设计 Prompt 引导模型"。

你需要放弃一些"确定性"的安全感,去接受模型的"不确定性"。

作为业务、产品、运营人员,学习 Agent 的 Skill Sets 设计,路径其实和做 SEO 很相似——都是把专业知识结构化。

这个话题值得单独展开,后续再专门写 Skills 实操指南。

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐