OpenClaw 技术分析:从配置到能力的核心解构
这不是一个 Python 项目,不是 Docker 镜像优先的方案,而是一个直接跑在宿主机上的 Node 进程,天然具备对本地文件系统、Shell 环境和网络的完整访问能力。当然,顶级模型(如 Claude Opus 4)的 Agent 能在一定程度上弥补提示词的不足——它会自动扫描可用 Skills、选择合适的工具、规划执行步骤。它的能力上限,由 Skills 的丰富度、模型的智能程度、以及你对
0. 前提配置
OpenClaw 的运行依赖两个基础前提:
Node.js 运行时 — OpenClaw 基于 Node.js 构建,当前推荐 v24.x。这不是一个 Python 项目,不是 Docker 镜像优先的方案,而是一个直接跑在宿主机上的 Node 进程,天然具备对本地文件系统、Shell 环境和网络的完整访问能力。
模型 API — 你需要至少一个大语言模型的 API 接入。OpenClaw 支持 Anthropic、OpenAI、Google 等主流提供商(模型配置文档)。模型是 OpenClaw 的"大脑",没有它,整个系统就是一个空壳。配置层面,你需要在 Gateway 配置中填入 API Key 并指定默认模型。
这两项是最低启动门槛。装好 Node,配好 Key,openclaw gateway start,你就有了一个活着的 Agent。
1. 决定能力的三大核心依赖
OpenClaw 能做什么,不取决于它"是什么",而取决于三个变量的组合:Skills、模型能力、提示词。三者缺一,能力就打折扣。
1.1 Skills:模块化的能力扩展
Skills 是 OpenClaw 的能力插件系统(Skills 文档)。一个 Skill 本质上是一个 SKILL.md 文件加上若干脚本和资源,遵循 AgentSkills 规范,告诉 Agent “遇到某类任务时该怎么做”。
Skills 从三个位置加载,优先级从高到低:
| 优先级 | 位置 | 说明 |
|---|---|---|
| 最高 | <workspace>/skills/ |
当前 Agent 工作区内的 Skill |
| 中 | ~/.openclaw/skills/ |
用户本地管理的 Skill(managed/local),所有 Agent 共享 |
| 最低 | Bundled skills | 随 OpenClaw 安装包自带的内置 Skill |
此外,还可以通过 skills.load.extraDirs 配置额外的 Skill 目录(优先级最低)。插件(Plugin)也可以附带自己的 Skills,在插件启用时参与正常的优先级加载。
同名 Skill 的覆盖规则很清晰:Workspace > Managed/Local > Bundled。你可以 fork 一个内置 Skill 到 Workspace 中做定制化修改,而不影响原始版本。在多 Agent 场景下,每个 Agent 有独立的 Workspace Skills,而 ~/.openclaw/skills/ 下的 Skill 则在同一台机器上的所有 Agent 之间共享。
社区方面,ClawHub 是 OpenClaw 的公共 Skill 注册中心,可以通过 clawhub install 安装社区 Skill 到 Workspace(ClawHub 文档)。
Skill 的强大之处在于它不只是"提示词模板"——它可以包含可执行脚本、参考文档、配置文件。比如 reddit-headless Skill 内置了完整的 Playwright 自动化流程,searxng Skill 封装了对本地搜索引擎实例的调用逻辑。Agent 在运行时会根据任务描述自动匹配最合适的 Skill,读取其 SKILL.md,然后按指引执行。
1.2 模型能力:Agent 的天花板
这是最容易被低估,也是最关键的一环。
OpenClaw 的会话以 Agent 为中心编排任务。Agent 收到用户指令后,需要理解意图、规划步骤、调用工具(工具系统文档)、处理结果、决定下一步。这整个循环依赖模型的 工具调用(Tool Use / Function Calling) 能力。
如果模型不具备工具调用能力,OpenClaw 就退化为一个普通的对话 AI。
没有工具调用,Agent 无法:
- 执行 Shell 命令(
exec) - 读写文件
- 操作浏览器(
browser) - 发送消息到外部渠道
- 创建定时任务(
cron) - 调用任何 Skill 中的脚本
它能做的只剩下"聊天"。这不是 OpenClaw 的问题,而是模型能力的边界直接决定了 Agent 能力的边界。
主流模型在 Agentic 场景下的对比(2026 年 2 月)
根据 WhatLLM.org 2026 年 1 月的 Agentic 模型排行榜(基于 Terminal-Bench、τ²-Bench、IFBench 等独立评测)以及 AristoAiStack 的横评数据:
第一梯队:顶级 Agentic 模型
- Claude Opus 4.5 / 4.6 — Anthropic 系列,推理深度和桌面自动化领先(OSWorld 72.7%),τ²-Bench 达到 90%,SWE-bench Verified 80.8%。OpenClaw 当前的默认主 Agent 模型,在多步规划、复杂工作流编排、浏览器自动化方面表现最稳定
- GPT-5.2 (xhigh) — OpenAI 最新旗舰,在 WhatLLM 排行榜综合排名第一,Terminal-Bench 44%,τ²-Bench 85%,IFBench 75%,工具调用可靠性 95%+,多步任务完成率出色
- Gemini 3 Pro — Google 旗舰,工具编排和 API 集成能力强,τ²-Bench 87%,在 Web Agent 场景下表现优异
第二梯队:高性价比选择
- GPT-5.3-Codex — OpenAI 2026 年 2 月发布的编码专用模型,Terminal-Bench 77.3%(大幅领先 Claude 的 65.4%),推理速度快约 25%,适合终端自动化和高吞吐执行场景,但推理深度不及 Claude Opus
- Claude Sonnet 4.5 — 性价比高,τ²-Bench 78%,日常任务够用,但在长链条任务中偶尔丢失上下文
- Gemini 3 Flash — 速度快、成本低,IFBench 78%,适合作为子任务模型
基本不可用
- GPT-4o — 2024 年发布的老模型,在 OpenClaw 体系下作为主 Agent 基本不可用,工具调用几乎全部失败,无法完成多步任务编排。这是一个很好的反面例子:并非所有"支持 function calling"的模型都能胜任 Agentic 工作流
- 更小/更早的模型 — 可以用于简单的子任务(通过
sessions_spawn指定model),但不建议作为主 Agent
选型建议
| 场景 | 推荐模型 |
|---|---|
| 主 Agent(复杂规划、多步编排) | Claude Opus 4.5/4.6、GPT-5.2 |
| 编码与终端自动化 | GPT-5.3-Codex、Claude Opus 4.6 |
| 浏览器/桌面自动化 | Claude Opus 4.6(OSWorld 领先 8 分) |
| 高性价比日常任务 | Claude Sonnet 4.5、Gemini 3 Flash |
| 子任务/轻量调度 | Gemini 3 Flash、GPT-5 mini |
1.3 提示词:释放能力的钥匙
拥有好的 Skills 和强大的模型,还需要一把钥匙把它们串起来——这就是提示词的作用。
但这里说的"提示词"不是简单的 prompt engineering。在 OpenClaw 的语境下,好的提示词意味着 使用者对整个系统有足够的理解:
- 了解 OpenClaw 有哪些内置工具(
exec、browser、web_search、cron等) - 知道已安装的 Skills 能做什么
- 理解 Agent 的工作模式(主会话 vs 子会话、同步 vs 后台执行)
- 清楚模型的能力边界(哪些任务适合当前模型,哪些需要升级)
举个例子,同样是"帮我在 Reddit 发个帖子":
❌ 新手提示:「帮我在 Reddit 发帖,标题是 xxx,内容是 xxx」
→ Agent 可能尝试用web_fetch或直接搜索 Reddit API,效率低且大概率失败
✅ 熟悉系统的提示:「用 reddit-headless skill 在 r/xxx 发一个文本帖,标题是 xxx,内容是 xxx」
→ Agent 直接加载对应 Skill,走 Playwright 自动化流程,成功率高
当然,顶级模型(如 Claude Opus 4)的 Agent 能在一定程度上弥补提示词的不足——它会自动扫描可用 Skills、选择合适的工具、规划执行步骤。但越复杂的任务,越依赖使用者给出清晰的意图和约束。
实际能力边界
以当前采用 Claude Opus 4 作为主 Agent 默认模型的配置,OpenClaw 已经可以稳定实现以下日常办公任务:
- 规划与编码 — 理解需求、拆解任务、编写代码、自我调试
- 内容创作 — 撰写文章、翻译、格式化输出
- 自我迭代 — 编写和改进 Skills(Skill Creator),扩展自身能力
- 浏览器自动化 — 操作 Playwright 或 CDP 控制的浏览器(Browser 文档),完成发帖、填表等操作
- 定时任务 — 通过 Cron 系统(Cron 文档)创建定时评论、邮件发送、数据检查
- 多渠道消息 — 对接 QQ、Telegram、Discord、微信等平台(消息渠道),实现跨渠道通知和交互
本质上,OpenClaw 把"一个能用工具的 AI"变成了"一个坐在你电脑前的数字员工"。它的能力上限,由 Skills 的丰富度、模型的智能程度、以及你对系统的理解共同决定。
三者的关系可以这样理解:Skills 是工具箱,模型是使用工具的手,提示词是告诉手该拿哪个工具的指令。 工具箱再全,手不够灵活也白搭;手再灵活,不知道该拿什么也是白忙。
更多推荐


所有评论(0)