【硬核】从零搭建16人AI数字员工团队：OpenClaw“龙虾”部署大战斗

禹笑笑-AI食用指南

1694人浏览 · 2026-03-07 20:29:21

禹笑笑-AI食用指南 · 2026-03-07 20:29:21 发布

从零搭建16人AI数字员工团队：OpenClaw“龙虾”部署大战斗

大家好，我是禹笑笑，目前已经完成 openclaw 的的第 n 次进化，现目前市面上的部署，大多只是在玩软件安装的事儿。后续我会更新我本地的 openclaw 架构！

声明：本文仅代表个人部署经历和观点，不针对任何工具或平台的商业价值进行评判。所有技术问题均来源于真实使用体验，旨在为后来者提供参考。

前言：一个程序员对AI员工系统的执念

2026年的春天，我做了一个大胆的决定：我要搭建一个拥有16人规模的AI数字员工团队。

这个想法源于一次深夜的技术反思。那时候，我每天疲于应付各种琐碎的技术任务——写代码、查文档、调Bug、做测试、分析数据、优化SEO、运营社交媒体……一个人活成了一支队伍，却总是感觉时间不够用。我开始思考：能不能让AI帮我干活？能不能像管理真实员工一样，管理一群AI Agent？

答案是：能，而且已经有人这么做了。

OpenClaw进入了我的视野。这是一个新兴的多Agent协作框架，核心理念是“AI原生开发”——不是让AI辅助编程，而是让AI自主完成整个软件开发流程。它支持多Agent分工协作，每个Agent都有明确的角色定位和技能树，能够像真实团队一样协同工作。

我决定：我要搭建一个包含CEO、产品负责人、技术负责人、营销负责人，以及各种工程师、运营、分析师在内的16人AI团队。

然而，理想很丰满，现实很骨感。整个部署过程，我踩了无数坑，其中最大的两个坑分别是：Trae沙箱环境的权限限制和文件架构能力的严重不足。

这篇文章，就是我的完整踩坑记录。我会详细讲述部署过程中的每一个关键步骤，重点剖析那些让我抓狂的问题，并分享最终的解决方案。希望对有类似想法的开发者有所帮助。

第一章：为什么选择OpenClaw

1.1 多Agent系统的崛起

在进入正题之前，我想先聊聊为什么我看好OpenClaw这类多Agent系统。

2025年是AI Agent爆发的一年。从AutoGPT到Devin，从Claude Code到Cursor，我们看到了AI从“工具”向“助手”演进的清晰路径。但单Agent的局限性也非常明显：它只能处理单一任务，无法理解复杂的业务场景，更谈不上跨角色协作。

举个例子，我想开发一个完整的SaaS产品，需要产品经理做需求分析、设计师出UI、工程师写代码、测试工程师验证、运营人员制定推广方案……这些角色之间的协作复杂度，远超单个AI模型的处理能力。

多Agent系统的出现，就是为了解决这个问题的。它的核心思路是让AI像人类一样分工协作：

CEO Agent负责全局规划和决策
产品Agent负责需求分析和功能规划
开发Agent负责代码实现
测试Agent负责质量保障
运营Agent负责推广和用户增长

每个Agent只专注自己的领域，通过标准化接口进行信息传递和任务流转，最终实现1+1>2的协同效应。

1.2 OpenClaw的核心特性

OpenClaw是2026年初发布的一个多Agent协作框架，它有几个非常吸引我的特性：

第一，角色定义清晰。OpenClaw采用“角色-技能”双层结构，每个Agent都有明确的角色定位（比如CEO、CTO、产品经理），以及对应的技能树（SKILL）。这种设计让Agent的专业性更强，输出质量更高。

第二，支持长时间运行。传统的AI对话是“问一句答一句”的短时模式，Agent的上下文窗口有限，无法处理复杂的长周期任务。OpenClaw支持“功能清单”模式，可以持续运行并跟踪多个任务的进度，非常适合项目管理场景。

第三，开放的系统架构。OpenClaw采用可插拔的架构设计，支持自定义Agent、自定义Skill、自定义工作流。它的配置文件采用人类可读的JSON格式，便于调试和二次开发。

第四，Telegram集成。这是我最钟爱的特性——OpenClaw可以直接通过Telegram机器人进行交互。这意味着我可以在手机上随时随地召唤我的AI员工团队，布置任务、查看进度、获取汇报。

基于以上特性，我决定在个人服务器上部署OpenClaw，搭建一个完整的16人AI团队。

第二章：部署前的准备工作

2.1 硬件与系统要求

OpenClaw是基于Node.js运行的多Agent系统，对硬件的要求并不高。根据官方文档：

操作系统：macOS、Linux（Windows通过WSL支持）
内存：至少8GB RAM（16GB更佳）
磁盘空间：至少10GB（取决于Agent数量和日志量）
网络：需要访问OpenAI/Anthropic等模型API

我的部署环境是MacBook Pro M3 Max + 外接三星T7 SSD。内存32GB，磁盘1TB，应该说是相当充裕的配置。

2.2 必要的账号和API Key

在开始部署之前，你需要准备以下账号和凭证：

1. OpenClaw账号

OpenClaw本身是开源免费的项目，但需要从GitHub克隆代码并本地安装。访问 https://github.com/openclaw 获取最新版本。

2. 大模型API

OpenClaw支持多种模型供应商，包括：

供应商	模型	特点	费用
OpenAI	GPT-5.4	2026最新旗舰，智能体时代	按token计费
Anthropic	Claude Opus 4.6	2026年2月发布，上下文1M	按token计费
Google	Gemini 2.5 Ultra	多模态能力强	按token计费
智谱AI	GLM-5	2026年2月发布，Agent能力提升	按token计费

重要提示：我在部署过程中尝试了智谱AI的GLM-5模型，但效果依然不太理想。具体问题我会在后面详细吐槽。

3. Telegram Bot（可选）

如果你想像我一样通过Telegram管理AI团队，需要：

在Telegram搜索 @BotFather
创建新机器人，获取HTTP API Token
记录你的Chat ID

2.3 项目目录规划

根据OpenClaw的最佳实践，建议采用以下目录结构：

~/.openclaw/
├── config/              # 配置文件
├── workspace/          # 工作空间（可迁移到外接硬盘）
│   ├── agents/         # Agent定义
│   ├── skills/         # Skill定义
│   └── projects/       # 项目文件
├── logs/               # 运行日志
└── data/               # 数据存储

特别注意：工作空间（workspace）会随着使用时间增长而变得非常大，建议一开始就规划将其存放在外接SSD上，而不是占用宝贵的本地磁盘空间。我在部署时就犯了这个错误，后来不得不进行迁移。

第三章：基础环境搭建

3.1 安装Node.js和依赖

OpenClaw基于Node.js开发，首先需要确保本地安装了Node.js环境：

# 检查Node.js版本
node --version

# 如果没有安装，使用nvm安装
curl -o- https://raw.githubusercontent.com/nvm-sh/nvm/v0.39.0/install.sh | bash
source ~/.zshrc
nvm install 20
nvm use 20

OpenClaw的安装非常简单：

# 克隆项目
git clone https://github.com/openclaw/openclaw.git
cd openclaw

# 安装依赖
npm install

# 全局安装CLI
npm install -g openclaw

安装完成后，验证安装：

openclaw --version
# 输出：openclaw v2026.3.2

3.2 初始化配置

第一次运行OpenClaw时，需要进行初始化配置：

openclaw init

这会创建一个基础的配置文件 ~/.openclaw/openclaw.json，包含模型供应商选择、API Key配置、Telegram Bot设置等选项。

配置示例：

{
  "provider": "openai",
  "model": "gpt-4o",
  "apiKey": "sk-xxxxx",
  "telegram": {
    "enabled": true,
    "botToken": "123456:xxxx",
    "chatId": "123456789"
  },
  "workspace": {
    "path": "~/.openclaw/workspace"
  }
}

3.3 启动Gateway

OpenClaw的核心组件是Gateway——它相当于AI团队的“大脑”，负责协调各个Agent之间的通信和任务分配。

启动命令：

openclaw gateway --port 18789

Gateway会在18789端口启动Web UI和API服务。访问 http://localhost:18789 可以看到控制面板。

第四章：Trae沙箱——我踩过的第一个大坑

4.1 一切美好的开始

在部署OpenClaw之前，我一直在使用Trae作为主要开发工具。Trae是字节跳动推出的AI编程助手，基于VS Code内核，集成 Claude 和 GPT 模型，在代码补全、bug修复、项目理解等方面表现出色。

我对Trae的印象一直不错。它能够理解项目结构、遵循编码规范、执行复杂的重构任务。特别是它的“规则文件”机制，允许开发者通过编写 .trae/rules/*.md 来定义项目的编码规范、架构约束和质量标准，非常适合团队协作。

所以，当我要部署OpenClaw时，很自然地想到：能不能在Trae里完成所有操作？

答案是：不能。

4.2 沙箱环境的权限陷阱

当我兴冲冲地在Trae终端里执行 openclaw gateway --port 18789 时，意想不到的错误出现了：

Error: EACCES: permission denied, mkdir '/Users/jeff/.openclaw'

这是一个权限错误。Trae运行在一个受限的“沙箱”（sandbox）环境中，这个环境对文件系统的访问有严格限制。具体来说：

无法创建 ~/.openclaw/ 目录：这是OpenClaw的默认配置目录
无法访问系统目录：比如 /usr/local/bin、/etc 等
无法执行某些系统命令：比如 ps（进程查看）、kill（进程终止）等

为什么会这样？这是Trae的安全机制。AI编程助手需要读取项目代码、执行命令，为了防止恶意代码对系统造成破坏，Trae在沙箱环境中运行所有操作。这个设计本身是合理的，但它导致了一个严重问题：

很多正常的开发任务，在沙箱里根本无法完成。

4.3 第一次部署失败

由于无法在Trae沙箱中创建配置目录，我的第一次OpenClaw部署尝试以失败告终。错误信息清楚地显示：

问题：沙箱环境 (trae-sandbox) 限制文件写入权限
原因：沙箱环境限制了文件写入权限，导致 OpenClaw 无法保存会话状态
解决：必须在本地终端运行 Gateway，不能通过 Trae 沙箱

这意味着，我必须切换到系统终端（Terminal.app）来运行OpenClaw，而不是在Trae的内置终端里。

这是一个让我非常沮丧的发现。因为我一直期望能够在统一的开发环境（Trae）里完成所有工作，包括部署和管理AI Agent。但现实是残酷的——Trae沙箱的设计初衷是代码开发，而不是服务部署。

4.4 绕过沙箱的尝试

我不死心，尝试了一些绕过方案：

方案一：在Trae里调用系统终端

理论上，我可以通过 Trae 的命令执行功能调用系统终端，但实际操作非常麻烦。每次部署都需要手动切换到系统终端，复制粘贴命令，效率极低。

方案二：修改OpenClaw的配置目录

OpenClaw支持通过环境变量指定配置目录：

OPENCLAW_HOME=/Volumes/jeff/trae-traceone/local/projects/openclaw-setup/.openclaw openclaw gateway

这样可以把配置目录改到Trae可以访问的路径。但这种方法治标不治本——后续的文件操作仍然会遇到权限问题。

方案三：授予Trae完整磁盘访问权限

macOS的隐私设置里可以授予应用“完全磁盘访问权限”。理论上，授予Trae这个权限后，它应该能够访问所有文件。但我发现，Traie的沙箱限制是内置在应用层面的，即使授予了系统权限，沙箱限制依然存在。

最终，我不得不接受现实：OpenClaw必须在系统终端里运行，Trae只负责项目代码开发。

第五章：Trae文件架构——被严重高估的能力

5.1 理想与现实的差距

如果说“沙箱权限”是Trae的先天缺陷，那么“文件架构能力”就是它的后天不足。

在部署OpenClaw的过程中，我需要管理大量的配置文件——16个Agent的定义、16个Skill的定义、多个规范文档、日志文件等等。这些文件需要清晰的目录结构和规范的命名约定。

作为一款“AI编程助手”，我原本期望Trae能够：

自动理解项目结构：看到目录就知道这是什么类型的项目
智能推荐文件位置：知道新文件应该放在哪里
自动生成配置模板：根据项目类型生成标准的配置文件
跨文件关联分析：理解文件之间的依赖关系

但实际使用中，Trae的文件架构能力让我大失所望。

5.2 文件管理的混乱

让我举几个具体的例子：

问题一：配置分散，难以统一管理

OpenClaw的配置文件分布在多个位置：

~/.openclaw/openclaw.json - 主配置
~/.openclaw/workspace/agents/*/agent.json - Agent定义
~/.openclaw/workspace/agents/*/skills/*/SKILL.md - Skill定义
~/.mcporter/mcporter.json - MCP集成配置

这些文件散落在不同目录，甚至不同磁盘（workspace可能在外接SSD上），Trae无法提供统一的配置管理视图。每次修改配置，都需要在文件浏览器里手动导航到对应目录，效率极低。

问题二：不支持符号链接

我的workspace目录实际上是一个符号链接，指向外接SSD上的真实目录：

~/.openclaw/workspace -> /Volumes/jeff/.openclaw/workspace

Trae在处理符号链接时表现不稳定，经常出现“文件找不到”的误报。这在大型项目管理中非常致命。

问题三：无法理解多模块项目

OpenClaw项目包含多个子模块：Agent定义、Skill定义、脚本、文档等。每个子模块有自己的目录结构和配置文件。Trae虽然能够解析单文件的语法，但无法理解这种多模块的架构关系，无法提供跨模块的代码重构或引用分析。

5.3 我的应对策略

面对Trae文件架构能力的不足，我被迫采用了一些补救措施：

策略一：建立规范文档

我在项目根目录创建了详细的README.md，详细说明每个目录的用途、文件的命名规范、配置的填写要求。这本质上是用“人工文档”来弥补工具能力的不足。

策略二：使用脚本批量操作

对于批量文件操作（如更新所有Agent配置），我编写了Shell脚本进行批量处理，减少手动操作。

策略三：切换到VS Code

在部署后期，我逐渐切换到VS Code进行文件管理。VS Code虽然也没有强大的文件架构能力，但它对符号链接和多目录项目的支持更稳定，而且插件生态更丰富。

策略四：手动部署

对于需要写入系统目录的操作（如部署Agent到 ~/.openclaw/），我最终选择了手动执行部署脚本，而不是依赖Trae的自动化能力。

第六章：智谱GLM模型——理想很丰满，现实很骨感

6.1 为什么要尝试国产模型

在部署OpenClaw时，我面临一个重要的选择：用哪个模型？

主流选择有OpenAI的GPT-5.4和Anthropic的Claude Opus 4.6。这两个模型在编程能力上都经过了广泛验证，是目前最成熟的选择。但我有两个顾虑：

网络问题：这两个模型都需要访问海外API，在中国大陆使用时可能遇到网络不稳定、延迟高等问题
成本问题：GPT-5.4和Claude Opus 4.6的API费用不低，特别是长时间运行的Agent系统

正好那段时间，智谱AI的GLM-5模型宣传得很火，声称在中文理解和编程能力上不逊于GPT-5，而且价格更便宜，API在国内访问速度快。作为支持国产AI的尝试，我决定给GLM-5一个机会。

6.2 GLM模型的糟糕体验

然而，GLM-5的实际表现让我大失所望。以下是我在部署过程中遇到的具体问题：

问题一：代码生成能力不足

当我让GLM-5生成Agent配置文件时，它经常出现以下问题：

生成的JSON格式不规范，缺少引号、逗号等
配置项理解错误，把"skill"理解成"技能点"而不是"技能定义"
重复生成相同的代码片段，无法理解上下文的连续性

示例对比：

GPT-5.4生成的配置：

{
  "name": "fullstack-engineer",
  "role": "全栈工程师",
  "skills": ["frontend", "backend", "database"],
  "tools": ["code-editor", "git", "docker"]
}

GLM-5生成的配置：

{
  "name": fullstack-engineer,  // 缺少引号
  role: 全栈工程师,             // 缺少引号
  skills: [frontend, backend]   // 缺少引号，且少了一个
}

这种基础性的语法错误，在GPT-5.4中几乎不会出现。

问题二：长文本理解能力有限

OpenClaw的Skill定义通常比较长，包含详细的行为规范、工具列表、约束条件等。GLM-5在处理超过2000字的 Skill文档时，经常出现"断片"现象——它会忘记前面提到的约束条件，或者混淆不同Skill的功能边界。

问题三：角色扮演能力弱

OpenClaw的核心是让AI扮演特定角色（CEO、工程师、运营等）。GPT-5.4和Claude Opus 4.6在角色扮演方面表现出色，能够保持角色一致性，始终以特定角色的视角思考和回答问题。

GLM-5在这方面的表现差强人意。它经常"跳出"角色，用一种"AI助手"的通用口吻回答问题，而不是扮演特定角色的语气。比如，我让一个"CTO Agent"评审代码，它会以"您好，我来帮您分析这段代码"的中立口吻回复，而不是以CTO的权威视角给出技术决策。

问题四：工具调用能力不稳定

OpenClaw支持Agent调用各种工具（执行命令、读写文件、调用API等）。GLM-5在工具调用方面的表现也不稳定：

有时候无法正确解析工具返回调用指令
-的参数格式不规范
工具执行失败后的错误处理不当

6.3 切换回GPT-5.4

在忍受了GLM-5的各种问题后，我最终决定切换回GPT-5.4。虽然成本更高，但稳定性和输出质量更有保障。

切换过程并不复杂——只需要修改配置文件中的 provider 和 model 字段：

{
  "provider": "openai",
  "model": "gpt-5.4",
  "apiKey": "sk-xxxxx"
}

重新启动Gateway后，Agent的表现立即提升了一个档次。代码生成规范了、角色扮演鲜明了、工具调用稳定了。

我的结论：在当前阶段，国产大模型（至少是GLM-5）在复杂Agent系统场景下，与GPT-5.4和Claude Opus 4.6还存在明显差距。这不是崇洋媚外，而是实事求是的技术评估。当然，国产模型在快速进步，期待未来能够达到国际一流水平。

第七章：16人团队的完整部署流程

7.1 Agent团队规划

经过仔细思考，我设计了以下16人AI团队架构：

龙虾营 (CEO)
├── 总办 (1人)
│   └── CEO - 负责全局规划、任务分发、进度汇报
│
├── 产品增长队 (5人)
│   └── 产品负责人 - 产品战略、需求管理
│       ├── 产品经理 - 需求分析、功能规划
│       ├── 数据分析师 - 数据收集、洞察分析
│       ├── 用户研究员 - 用户调研、体验优化
│       └── 内容策略师 - 内容规划、品牌策略
│
├── 技术平台队 (6人)
│   └── 技术负责人 - 技术架构、代码审查
│       ├── 全栈工程师 - 全栈开发
│       ├── 前端工程师 - UI/UX开发
│       ├── 后端工程师 - API开发
│       └── QA工程师 - 测试、质量保障
│
└── 营销增长队 (4人)
    └── 营销负责人 - 营销策略、渠道管理
        ├── 增长黑客 - 数据增长、裂变策略
        ├── 社媒运营 - 社交媒体运营
        ├── SEO专员 - 搜索引擎优化
        └── 客户成功 - 客户服务支持

这个架构参考了真实公司的组织结构，每个角色都有明确的职责边界和协作接口。

7.2 Skill系统配置

Skill是OpenClaw的核心概念。每个Agent通过Skill来获得特定领域的能力。Skill本质上是一个配置文件（SKILL.md），定义了：

角色描述：Agent的身份定位
能力清单：Agent能做什么
约束条件：Agent不能做什么
工具列表：Agent可以使用的工具
示例对话：如何与Agent交互

Skill结构示例（以全栈工程师为例）：

# 全栈工程师 Skill

## 角色描述
你是一位经验丰富的全栈工程师，擅长Web应用开发。

## 能力清单
- 前端开发：React、Vue、TypeScript
- 后端开发：Node.js、Python、Go
- 数据库：PostgreSQL、MongoDB、Redis
- DevOps：Docker、K8s、CI/CD

## 约束条件
- 不修改生产环境配置
- 代码必须经过测试才能提交
- 遵循团队编码规范

## 工具列表
- code_editor：代码编写
- git：版本控制
- docker：容器化
- terminal：终端命令

7.3 部署步骤详解

步骤一：创建Agent目录

为每个Agent创建独立的目录：

mkdir -p ~/.openclaw/workspace/agents/01-ceo
mkdir -p ~/.openclaw/workspace/agents/02-product-lead
mkdir -p ~/.openclaw/workspace/agents/03-tech-lead
# ... 以此类推，创建全部16个Agent目录

步骤二：配置Agent定义

在每个Agent目录下创建 agent.json：

# 01-ceo/agent.json
{
  "id": "01-ceo",
  "name": "CEO",
  "role": "总经理",
  "description": "负责公司全局规划和任务分发",
  "skills": ["ai-native-spec", "ceo-command", "decision-making"],
  "model": "gpt-4o"
}

步骤三：部署Skill

将Skill文件复制到对应目录：

# 复制Skill到全栈工程师
mkdir -p ~/.openclaw/workspace/agents/06-fullstack-engineer/skills/fullstack
cp /path/to/project/skill-templates/engineering/fullstack/SKILL.md \
   ~/.openclaw/workspace/agents/06-fullstack-engineer/skills/fullstack/SKILL.md

步骤四：配置安全策略

OpenClaw支持细粒度的安全控制，创建安全策略文件：

# config/security-layer1-basic.md
# 权限级别定义
| 角色 | 文件读取 | 文件写入 | 命令执行 |
|------|----------|----------|----------|
| Admin | 全部 | 全部 | 全部 |
| CEO | 全部 | workspace/ | 允许 |
| Engineer | workspace/ | workspace/src/ | 限制 |

步骤五：启动并验证

# 启动Gateway
openclaw gateway --port 18789

# 验证Agent列表
openclaw agents list

# 测试调用
openclaw agent --agent 01-ceo --message "汇报今天的工作进展"

7.4 Telegram集成配置

为了让团队管理更便捷，我配置了Telegram Bot：

1. 创建Bot

在Telegram搜索 @BotFather，输入 /newbot 创建一个新机器人，获取API Token。

2. 获取Chat ID

搜索 @userinfobot，获取你的Chat ID。

3. 配置OpenClaw

编辑 ~/.openclaw/openclaw.json：

{
  "telegram": {
    "enabled": true,
    "botToken": "123456:ABCxxxx",
    "chatId": "123456789"
  }
}

4. 重启Gateway

# 停止当前Gateway
# Ctrl+C

# 重新启动
openclaw gateway --port 18789

现在，你可以在Telegram里这样召唤AI员工：

@digitaljeff_bot 请CEO汇报今天的工作进展
@digitaljeff_bot 让全栈工程师优化首页加载速度
@digitaljeff_bot 数据分析师分析上周的 用户增长数据

第八章：Browser MCP集成——如虎添翼

8.1 浏览器自动化的需求

在管理AI团队的过程中，我发现一个痛点：很多任务需要浏览器操作，比如：

访问网站获取数据
截图保存证据
自动化测试Web应用
填写表单、提交申请

传统的解决方案是使用Selenium或Playwright，但这些工具需要编写大量代码，对AI Agent不够友好。

agent-browser 是一个新兴的浏览器自动化工具，它的核心特点是“AI原生设计”——专门为AI Agent优化的交互界面。

8.2 agent-browser的核心优势

优势一：Ref-based元素定位

传统方式需要写复杂的CSS选择器或XPath：

// Playwright
await page.click('#main > div.content > button.submit');
await page.click('button[type="submit"]');

agent-browser采用基于Ref的定位方式：

# 1. 获取快照（自动分配唯一ref）
agent-browser snapshot
# 输出：- button "Submit" [ref=e15]

# 2. 使用ref操作
agent-browser click @e15

这种方式更简洁、更稳定、更AI友好。

优势二：Token效率高

agent-browser的输出是紧凑的文本树格式：

- heading "Example Domain" [ref=e1]
- link "More information..." [ref=e2]
≈ 200-400 tokens

而Playwright输出完整的DOM JSON：

{
  "html": "<html><head>...</head><body>...",
  "elements": [...]
}
≈ 3000-5000 tokens

节省10倍以上的Token！

优势三：无需API Key

agent-browser是纯本地工具，基于Playwright，不需要任何云服务API Key。

8.3 MCP Server开发

为了让OpenClaw能够调用agent-browser，我开发了一个MCP Server（Model Context Protocol Server）。

MCP是Anthropic提出的标准化协议，用于让AI模型与外部工具进行交互。通过MCP Server，可以把任意命令行工具封装成AI可调用的工具。

核心开发内容：

TypeScript MCP Server：720行代码
22个浏览器工具：open、snapshot、click、type、screenshot等
OpenClaw Skill：定义如何调用这些工具

MCP Server代码示例：

import { FastMCP } from "fastmcp";
import { z } from "zod";

const server = new FastMCP({
  name: "Agent-Browser MCP",
  version: "1.0.0",
});

server.addTool({
  name: "browser.open",
  description: "打开网页",
  parameters: z.object({
    url: z.string().describe("要打开的URL"),
  }),
  execute: async ({ url }) => {
    const output = execSync(`agent-browser open "${url}"`);
    return `✅ 已打开网页：${url}\n${output}`;
  },
});

8.4 部署到OpenClaw

由于OpenClaw不支持原生MCP配置（这是一个遗憾的设计），需要通过MCPorter进行集成：

1. 配置MCPorter

编辑 ~/.mcporter/mcporter.json：

{
  "mcpServers": {
    "agent-browser": {
      "command": "npx",
      "args": ["tsx", "/path/to/mcp-server/src/index.ts", "--stdio"],
      "description": "AI原生的浏览器自动化工具"
    }
  }
}

2. 创建OpenClaw Skill

在对应Agent的skills目录下创建Skill文件，定义如何调用MCP工具。

3. 重启Gateway

openclaw gateway restart

现在，全栈工程师Agent可以这样执行浏览器任务：

请用agent-browser打开GitHub，登录并获取首页快照

第九章：Workspace迁移——空间管理优化

9.1 磁盘空间告急

随着使用的深入，OpenClaw的工作空间（workspace）迅速膨胀：

Agent配置文件：~50MB
Skill文档：~100MB
项目代码：~500MB
运行日志：~200MB
临时文件：~100MB

总计接近1GB，而且还在持续增长。本地磁盘开始告急，我决定把workspace迁移到外接SSD上。

9.2 迁移方案

方案一：修改配置指向新路径

最简单的方式是修改 openclaw.json 中的 workspace.path 配置：

{
  "workspace": {
    "path": "/Volumes/jeff/.openclaw/workspace"
  }
}

但这会导致配置文件中所有绝对路径失效，需要重新配置。

方案二：使用符号链接（推荐）

保持原有配置不变，将 ~/.openclaw/workspace 替换为指向外接SSD的符号链接：

# 1. 停止Gateway
# Ctrl+C

# 2. 移动现有文件到外接SSD
mv ~/.openclaw/workspace /Volumes/jeff/.openclaw/workspace

# 3. 创建符号链接
ln -s /Volumes/jeff/.openclaw/workspace ~/.openclaw/workspace

# 4. 验证
ls -la ~/.openclaw/workspace
# 输出：... /Users/jeff/.openclaw/workspace -> /Volumes/jeff/.openclaw/workspace

9.3 注意事项

1. 外接SSD必须保持连接

Workspace迁移后，每次启动OpenClaw都需要确保外接SSD已连接并挂载。否则会报“目录不存在”错误。

2. 备份重要配置

迁移前务必备份关键配置文件：

# 备份配置
cp ~/.openclaw/openclaw.json ~/.openclaw/openclaw.json.bak

3. 处理权限问题

外接SSD的文件权限可能与本地磁盘不同，需要确保当前用户有读写权限：

chmod -R 755 /Volumes/jeff/.openclaw
chown -R jeff:staff /Volumes/jeff/.openclaw

第十章：经验总结与建议

10.1 关于Trae的教训

教训一：不要在Trae沙箱里部署服务

Trae的沙箱设计是为了代码开发，而不是服务部署。任何需要写入系统目录、创建持久化服务的操作，都不适合在Trae里完成。

正确做法：

使用Trae进行代码开发、调试
使用系统终端（Terminal.app）进行服务部署
两者配合，各取所长

教训二：Trae的文件架构能力有限

Trae在代码补全、语法分析、Bug修复方面表现出色，但它缺乏对复杂项目架构的理解能力。对于多模块、多目录的项目管理，Trae的帮助有限。

正确做法：

建立清晰的文档规范
使用脚本进行批量操作
考虑使用专门的项目管理工具

10.2 关于模型选择的建议

建议一：优先选择成熟模型

GPT-5.4和Claude Opus 4.6经过了大量实际使用验证，稳定性有保障。在关键业务场景中，不要为了节省成本而选择未经充分验证的模型。

建议二：国产模型还需观望

虽然我对国产AI的发展充满期待，但在当前阶段，GLM-5等国产大模型在复杂Agent场景下与国际一流水平还有明显差距。建议在非关键场景下进行尝试，而不是直接用于生产环境。

10.3 关于OpenClaw的改进建议

建议一：原生支持MCP

OpenClaw通过MCPorter支持MCP，但这种方式增加了复杂度。用户更期望OpenClaw能够原生支持MCP协议，就像Claude Code一样。

建议二：完善文档和示例

OpenClaw的官方文档相对简略，很多高级功能（如长时间运行、自定义工作流）缺乏详细的使用示例。建议增加更多教程和最佳实践文档。

建议三：增强角色扮演能力

当前版本的Agent在角色扮演方面还有提升空间。有时候Agent会“跳出”角色，用通用口吻回复。建议在系统层面增强角色一致性保障。

10.4 给后来者的建议

如果你也打算部署OpenClaw或类似的AI Agent系统，以下是我的建议：

充分了解工具限制：在开始之前，全面了解目标工具的能力边界和已知问题
做好环境隔离：开发环境和生产环境分开，避免互相影响
重视数据备份：配置文件、日志文件定期备份，防止意外丢失
循序渐进：先从简单的单Agent场景开始，逐步扩展到复杂的多Agent协作
持续优化：Agent系统需要持续调优，不要期望一次部署就达到完美效果

第十一章：未来展望

11.1 AI员工团队的进化

部署完成只是开始，16人AI团队的真正价值在于持续运营和优化。未来的发展方向包括：

1. 技能深化

每个Agent的Skill需要不断迭代优化。随着使用场景的丰富，Skill会越来越精准，输出质量会越来越高。

2. 协作优化

16个Agent之间的协作流程需要持续打磨。如何减少信息传递损耗、如何避免任务重复、如何提升协同效率，这些都是需要探索的问题。

3. 知识积累

每次任务的执行都会产生大量数据。通过分析这些数据，可以发现Agent的薄弱环节，优化提示词设计，最终形成组织的“知识资产”。

11.2 技术架构的演进

1. 模型升级

随着GPT-5、Claude 4等新一代模型的发布，Agent的能力会进一步提升。架构设计上要预留升级空间。

2. 工具扩展

除了浏览器自动化，还可以集成更多工具，比如：

代码执行环境（Docker沙箱）
数据库操作
API调用
邮件/消息发送

3. 多模态能力

未来的Agent不仅要能处理文本，还要能理解图片、语音、视频。多模态能力的加入会让AI员工团队更加强大。

结语

回顾整个OpenClaw部署过程，我踩过的坑比预想的多得多。Trae沙箱的权限限制、文件架构能力的不足、GLM模型的糟糕体验……每一个问题都让我抓狂。

但正是这些坑，让我对AI Agent系统有了更深的理解。工具只是工具，再强大的AI也需要合适的环境和正确的使用方法。

16人AI团队已经部署完成，现在每天都在帮我处理各种工作任务。CEO负责规划和汇报、产品经理负责需求分析、工程师负责代码开发、运营负责内容发布……这种体验是前所未有的。

当然，系统还远未完美。Agent的能力边界、协作效率、输出质量都还有很大的提升空间。但我相信，这是一条正确的道路。

正如我一开始所说的：我要让AI像人类一样工作。这不是遥不可及的梦想，而是正在发生的现实。

如果你也对AI Agent感兴趣，不妨从今天开始，尝试搭建属于自己的AI团队。你会发现，这片天地远比想象中更加广阔。

文章字数：约10500字

写作时间：2026年3月

相关项目：

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

Claude Code 进行“从头重写”的项目 Claw Code全面介绍（claw-code）

Claw-code是一个基于泄露的Claude Code进行重写的开源项目，专注于构建智能体运行时框架。该项目采用Python优先实现与Rust移植并行的策略，强调洁净室开发模式而非直接使用泄露代码。主要特点包括：模块化架构设计、清晰的移植进度追踪、完整的测试框架和工程化工具链。项目提供了丰富的CLI命令用于系统自省和模拟运行时行为，并通过QueryEngine实现会话状态管理。Rust工作区则致