OpenClaw 技术分析：从配置到能力的核心解构

这不是一个 Python 项目，不是 Docker 镜像优先的方案，而是一个直接跑在宿主机上的 Node 进程，天然具备对本地文件系统、Shell 环境和网络的完整访问能力。当然，顶级模型（如 Claude Opus 4）的 Agent 能在一定程度上弥补提示词的不足——它会自动扫描可用 Skills、选择合适的工具、规划执行步骤。它的能力上限，由 Skills 的丰富度、模型的智能程度、以及你对

magicwindyyd

561人浏览 · 2026-02-25 13:39:07

magicwindyyd · 2026-02-25 13:39:07 发布

0. 前提配置

OpenClaw 的运行依赖两个基础前提：

Node.js 运行时 — OpenClaw 基于 Node.js 构建，当前推荐 v24.x。这不是一个 Python 项目，不是 Docker 镜像优先的方案，而是一个直接跑在宿主机上的 Node 进程，天然具备对本地文件系统、Shell 环境和网络的完整访问能力。

模型 API — 你需要至少一个大语言模型的 API 接入。OpenClaw 支持 Anthropic、OpenAI、Google 等主流提供商（模型配置文档）。模型是 OpenClaw 的"大脑"，没有它，整个系统就是一个空壳。配置层面，你需要在 Gateway 配置中填入 API Key 并指定默认模型。

这两项是最低启动门槛。装好 Node，配好 Key，openclaw gateway start，你就有了一个活着的 Agent。

1. 决定能力的三大核心依赖

OpenClaw 能做什么，不取决于它"是什么"，而取决于三个变量的组合：Skills、模型能力、提示词。三者缺一，能力就打折扣。

1.1 Skills：模块化的能力扩展

Skills 是 OpenClaw 的能力插件系统（Skills 文档）。一个 Skill 本质上是一个 SKILL.md 文件加上若干脚本和资源，遵循 AgentSkills 规范，告诉 Agent “遇到某类任务时该怎么做”。

Skills 从三个位置加载，优先级从高到低：

优先级	位置	说明
最高	`<workspace>/skills/`	当前 Agent 工作区内的 Skill
中	`~/.openclaw/skills/`	用户本地管理的 Skill（managed/local），所有 Agent 共享
最低	Bundled skills	随 OpenClaw 安装包自带的内置 Skill

此外，还可以通过 skills.load.extraDirs 配置额外的 Skill 目录（优先级最低）。插件（Plugin）也可以附带自己的 Skills，在插件启用时参与正常的优先级加载。

同名 Skill 的覆盖规则很清晰：Workspace > Managed/Local > Bundled。你可以 fork 一个内置 Skill 到 Workspace 中做定制化修改，而不影响原始版本。在多 Agent 场景下，每个 Agent 有独立的 Workspace Skills，而 ~/.openclaw/skills/ 下的 Skill 则在同一台机器上的所有 Agent 之间共享。

社区方面，ClawHub 是 OpenClaw 的公共 Skill 注册中心，可以通过 clawhub install 安装社区 Skill 到 Workspace（ClawHub 文档）。

Skill 的强大之处在于它不只是"提示词模板"——它可以包含可执行脚本、参考文档、配置文件。比如 reddit-headless Skill 内置了完整的 Playwright 自动化流程，searxng Skill 封装了对本地搜索引擎实例的调用逻辑。Agent 在运行时会根据任务描述自动匹配最合适的 Skill，读取其 SKILL.md，然后按指引执行。

1.2 模型能力：Agent 的天花板

这是最容易被低估，也是最关键的一环。

OpenClaw 的会话以 Agent 为中心编排任务。Agent 收到用户指令后，需要理解意图、规划步骤、调用工具（工具系统文档）、处理结果、决定下一步。这整个循环依赖模型的 工具调用（Tool Use / Function Calling） 能力。

如果模型不具备工具调用能力，OpenClaw 就退化为一个普通的对话 AI。

没有工具调用，Agent 无法：

执行 Shell 命令（exec）
读写文件
操作浏览器（browser）
发送消息到外部渠道
创建定时任务（cron）
调用任何 Skill 中的脚本

它能做的只剩下"聊天"。这不是 OpenClaw 的问题，而是模型能力的边界直接决定了 Agent 能力的边界。

主流模型在 Agentic 场景下的对比（2026 年 2 月）

根据 WhatLLM.org 2026 年 1 月的 Agentic 模型排行榜（基于 Terminal-Bench、τ²-Bench、IFBench 等独立评测）以及 AristoAiStack 的横评数据：

第一梯队：顶级 Agentic 模型

Claude Opus 4.5 / 4.6 — Anthropic 系列，推理深度和桌面自动化领先（OSWorld 72.7%），τ²-Bench 达到 90%，SWE-bench Verified 80.8%。OpenClaw 当前的默认主 Agent 模型，在多步规划、复杂工作流编排、浏览器自动化方面表现最稳定
GPT-5.2 (xhigh) — OpenAI 最新旗舰，在 WhatLLM 排行榜综合排名第一，Terminal-Bench 44%，τ²-Bench 85%，IFBench 75%，工具调用可靠性 95%+，多步任务完成率出色
Gemini 3 Pro — Google 旗舰，工具编排和 API 集成能力强，τ²-Bench 87%，在 Web Agent 场景下表现优异

第二梯队：高性价比选择

GPT-5.3-Codex — OpenAI 2026 年 2 月发布的编码专用模型，Terminal-Bench 77.3%（大幅领先 Claude 的 65.4%），推理速度快约 25%，适合终端自动化和高吞吐执行场景，但推理深度不及 Claude Opus
Claude Sonnet 4.5 — 性价比高，τ²-Bench 78%，日常任务够用，但在长链条任务中偶尔丢失上下文
Gemini 3 Flash — 速度快、成本低，IFBench 78%，适合作为子任务模型

基本不可用

GPT-4o — 2024 年发布的老模型，在 OpenClaw 体系下作为主 Agent 基本不可用，工具调用几乎全部失败，无法完成多步任务编排。这是一个很好的反面例子：并非所有"支持 function calling"的模型都能胜任 Agentic 工作流
更小/更早的模型 — 可以用于简单的子任务（通过 sessions_spawn 指定 model），但不建议作为主 Agent

选型建议

场景	推荐模型
主 Agent（复杂规划、多步编排）	Claude Opus 4.5/4.6、GPT-5.2
编码与终端自动化	GPT-5.3-Codex、Claude Opus 4.6
浏览器/桌面自动化	Claude Opus 4.6（OSWorld 领先 8 分）
高性价比日常任务	Claude Sonnet 4.5、Gemini 3 Flash
子任务/轻量调度	Gemini 3 Flash、GPT-5 mini

1.3 提示词：释放能力的钥匙

拥有好的 Skills 和强大的模型，还需要一把钥匙把它们串起来——这就是提示词的作用。

但这里说的"提示词"不是简单的 prompt engineering。在 OpenClaw 的语境下，好的提示词意味着 使用者对整个系统有足够的理解：

了解 OpenClaw 有哪些内置工具（exec、browser、web_search、cron 等）
知道已安装的 Skills 能做什么
理解 Agent 的工作模式（主会话 vs 子会话、同步 vs 后台执行）
清楚模型的能力边界（哪些任务适合当前模型，哪些需要升级）

举个例子，同样是"帮我在 Reddit 发个帖子"：

❌ 新手提示：「帮我在 Reddit 发帖，标题是 xxx，内容是 xxx」
→ Agent 可能尝试用 web_fetch 或直接搜索 Reddit API，效率低且大概率失败

✅ 熟悉系统的提示：「用 reddit-headless skill 在 r/xxx 发一个文本帖，标题是 xxx，内容是 xxx」
→ Agent 直接加载对应 Skill，走 Playwright 自动化流程，成功率高

当然，顶级模型（如 Claude Opus 4）的 Agent 能在一定程度上弥补提示词的不足——它会自动扫描可用 Skills、选择合适的工具、规划执行步骤。但越复杂的任务，越依赖使用者给出清晰的意图和约束。

实际能力边界

以当前采用 Claude Opus 4 作为主 Agent 默认模型的配置，OpenClaw 已经可以稳定实现以下日常办公任务：

规划与编码 — 理解需求、拆解任务、编写代码、自我调试
内容创作 — 撰写文章、翻译、格式化输出
自我迭代 — 编写和改进 Skills（Skill Creator），扩展自身能力
浏览器自动化 — 操作 Playwright 或 CDP 控制的浏览器（Browser 文档），完成发帖、填表等操作
定时任务 — 通过 Cron 系统（Cron 文档）创建定时评论、邮件发送、数据检查
多渠道消息 — 对接 QQ、Telegram、Discord、微信等平台（消息渠道），实现跨渠道通知和交互

本质上，OpenClaw 把"一个能用工具的 AI"变成了"一个坐在你电脑前的数字员工"。它的能力上限，由 Skills 的丰富度、模型的智能程度、以及你对系统的理解共同决定。

三者的关系可以这样理解：Skills 是工具箱，模型是使用工具的手，提示词是告诉手该拿哪个工具的指令。 工具箱再全，手不够灵活也白搭；手再灵活，不知道该拿什么也是白忙。

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

Notepad++编写html文件使用D3绘图：数据可视化

2048 AI社区

007、软件栈基石：通信库MPI、NCCL与UCX深度解析

从一次诡异的训练卡顿说起上个月调一个八卡A100的集群，训练脚本跑起来后，吞吐量只有理论值的一半。nvidia-smi显示GPU利用率像心电图一样上蹿下跳，netstat看网络流量也是忽高忽低。折腾了两天，最后发现是NCCL的通信模式没选对——默认的P2P模式在跨NUMA节点的机器上表现极差，换成NVLinkInfiniBand混合拓扑后性能直接翻倍。这个坑让我重新审视了AI集群里的通信库。现在大