0. 前提配置

OpenClaw 的运行依赖两个基础前提:

Node.js 运行时 — OpenClaw 基于 Node.js 构建,当前推荐 v24.x。这不是一个 Python 项目,不是 Docker 镜像优先的方案,而是一个直接跑在宿主机上的 Node 进程,天然具备对本地文件系统、Shell 环境和网络的完整访问能力。

模型 API — 你需要至少一个大语言模型的 API 接入。OpenClaw 支持 Anthropic、OpenAI、Google 等主流提供商(模型配置文档)。模型是 OpenClaw 的"大脑",没有它,整个系统就是一个空壳。配置层面,你需要在 Gateway 配置中填入 API Key 并指定默认模型。

这两项是最低启动门槛。装好 Node,配好 Key,openclaw gateway start,你就有了一个活着的 Agent。

1. 决定能力的三大核心依赖

OpenClaw 能做什么,不取决于它"是什么",而取决于三个变量的组合:Skills、模型能力、提示词。三者缺一,能力就打折扣。

1.1 Skills:模块化的能力扩展

Skills 是 OpenClaw 的能力插件系统(Skills 文档)。一个 Skill 本质上是一个 SKILL.md 文件加上若干脚本和资源,遵循 AgentSkills 规范,告诉 Agent “遇到某类任务时该怎么做”。

Skills 从三个位置加载,优先级从高到低:

优先级 位置 说明
最高 <workspace>/skills/ 当前 Agent 工作区内的 Skill
~/.openclaw/skills/ 用户本地管理的 Skill(managed/local),所有 Agent 共享
最低 Bundled skills 随 OpenClaw 安装包自带的内置 Skill

此外,还可以通过 skills.load.extraDirs 配置额外的 Skill 目录(优先级最低)。插件(Plugin)也可以附带自己的 Skills,在插件启用时参与正常的优先级加载。

同名 Skill 的覆盖规则很清晰:Workspace > Managed/Local > Bundled。你可以 fork 一个内置 Skill 到 Workspace 中做定制化修改,而不影响原始版本。在多 Agent 场景下,每个 Agent 有独立的 Workspace Skills,而 ~/.openclaw/skills/ 下的 Skill 则在同一台机器上的所有 Agent 之间共享。

社区方面,ClawHub 是 OpenClaw 的公共 Skill 注册中心,可以通过 clawhub install 安装社区 Skill 到 Workspace(ClawHub 文档)。

Skill 的强大之处在于它不只是"提示词模板"——它可以包含可执行脚本、参考文档、配置文件。比如 reddit-headless Skill 内置了完整的 Playwright 自动化流程,searxng Skill 封装了对本地搜索引擎实例的调用逻辑。Agent 在运行时会根据任务描述自动匹配最合适的 Skill,读取其 SKILL.md,然后按指引执行。

1.2 模型能力:Agent 的天花板

这是最容易被低估,也是最关键的一环。

OpenClaw 的会话以 Agent 为中心编排任务。Agent 收到用户指令后,需要理解意图、规划步骤、调用工具(工具系统文档)、处理结果、决定下一步。这整个循环依赖模型的 工具调用(Tool Use / Function Calling) 能力。

如果模型不具备工具调用能力,OpenClaw 就退化为一个普通的对话 AI。

没有工具调用,Agent 无法:

  • 执行 Shell 命令(exec
  • 读写文件
  • 操作浏览器(browser
  • 发送消息到外部渠道
  • 创建定时任务(cron
  • 调用任何 Skill 中的脚本

它能做的只剩下"聊天"。这不是 OpenClaw 的问题,而是模型能力的边界直接决定了 Agent 能力的边界。

主流模型在 Agentic 场景下的对比(2026 年 2 月)

根据 WhatLLM.org 2026 年 1 月的 Agentic 模型排行榜(基于 Terminal-Bench、τ²-Bench、IFBench 等独立评测)以及 AristoAiStack 的横评数据:

第一梯队:顶级 Agentic 模型

  • Claude Opus 4.5 / 4.6 — Anthropic 系列,推理深度和桌面自动化领先(OSWorld 72.7%),τ²-Bench 达到 90%,SWE-bench Verified 80.8%。OpenClaw 当前的默认主 Agent 模型,在多步规划、复杂工作流编排、浏览器自动化方面表现最稳定
  • GPT-5.2 (xhigh) — OpenAI 最新旗舰,在 WhatLLM 排行榜综合排名第一,Terminal-Bench 44%,τ²-Bench 85%,IFBench 75%,工具调用可靠性 95%+,多步任务完成率出色
  • Gemini 3 Pro — Google 旗舰,工具编排和 API 集成能力强,τ²-Bench 87%,在 Web Agent 场景下表现优异

第二梯队:高性价比选择

  • GPT-5.3-Codex — OpenAI 2026 年 2 月发布的编码专用模型,Terminal-Bench 77.3%(大幅领先 Claude 的 65.4%),推理速度快约 25%,适合终端自动化和高吞吐执行场景,但推理深度不及 Claude Opus
  • Claude Sonnet 4.5 — 性价比高,τ²-Bench 78%,日常任务够用,但在长链条任务中偶尔丢失上下文
  • Gemini 3 Flash — 速度快、成本低,IFBench 78%,适合作为子任务模型

基本不可用

  • GPT-4o — 2024 年发布的老模型,在 OpenClaw 体系下作为主 Agent 基本不可用,工具调用几乎全部失败,无法完成多步任务编排。这是一个很好的反面例子:并非所有"支持 function calling"的模型都能胜任 Agentic 工作流
  • 更小/更早的模型 — 可以用于简单的子任务(通过 sessions_spawn 指定 model),但不建议作为主 Agent
选型建议
场景 推荐模型
主 Agent(复杂规划、多步编排) Claude Opus 4.5/4.6、GPT-5.2
编码与终端自动化 GPT-5.3-Codex、Claude Opus 4.6
浏览器/桌面自动化 Claude Opus 4.6(OSWorld 领先 8 分)
高性价比日常任务 Claude Sonnet 4.5、Gemini 3 Flash
子任务/轻量调度 Gemini 3 Flash、GPT-5 mini

1.3 提示词:释放能力的钥匙

拥有好的 Skills 和强大的模型,还需要一把钥匙把它们串起来——这就是提示词的作用。

但这里说的"提示词"不是简单的 prompt engineering。在 OpenClaw 的语境下,好的提示词意味着 使用者对整个系统有足够的理解

  • 了解 OpenClaw 有哪些内置工具(execbrowserweb_searchcron 等)
  • 知道已安装的 Skills 能做什么
  • 理解 Agent 的工作模式(主会话 vs 子会话、同步 vs 后台执行)
  • 清楚模型的能力边界(哪些任务适合当前模型,哪些需要升级)

举个例子,同样是"帮我在 Reddit 发个帖子":

新手提示:「帮我在 Reddit 发帖,标题是 xxx,内容是 xxx」
→ Agent 可能尝试用 web_fetch 或直接搜索 Reddit API,效率低且大概率失败

熟悉系统的提示:「用 reddit-headless skill 在 r/xxx 发一个文本帖,标题是 xxx,内容是 xxx」
→ Agent 直接加载对应 Skill,走 Playwright 自动化流程,成功率高

当然,顶级模型(如 Claude Opus 4)的 Agent 能在一定程度上弥补提示词的不足——它会自动扫描可用 Skills、选择合适的工具、规划执行步骤。但越复杂的任务,越依赖使用者给出清晰的意图和约束。

实际能力边界

以当前采用 Claude Opus 4 作为主 Agent 默认模型的配置,OpenClaw 已经可以稳定实现以下日常办公任务:

  • 规划与编码 — 理解需求、拆解任务、编写代码、自我调试
  • 内容创作 — 撰写文章、翻译、格式化输出
  • 自我迭代 — 编写和改进 Skills(Skill Creator),扩展自身能力
  • 浏览器自动化 — 操作 Playwright 或 CDP 控制的浏览器(Browser 文档),完成发帖、填表等操作
  • 定时任务 — 通过 Cron 系统(Cron 文档)创建定时评论、邮件发送、数据检查
  • 多渠道消息 — 对接 QQ、Telegram、Discord、微信等平台(消息渠道),实现跨渠道通知和交互

本质上,OpenClaw 把"一个能用工具的 AI"变成了"一个坐在你电脑前的数字员工"。它的能力上限,由 Skills 的丰富度、模型的智能程度、以及你对系统的理解共同决定。

三者的关系可以这样理解:Skills 是工具箱,模型是使用工具的手,提示词是告诉手该拿哪个工具的指令。 工具箱再全,手不够灵活也白搭;手再灵活,不知道该拿什么也是白忙。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐