1、GStack 架构全景:23 个 Skill 的虚拟公司

1.1、gstack 是什么

gstack 是 Y Combinator CEO Garry Tan 开源的一套 Claude Code 工作流技能集。它把 Claude Code 从一个"会写代码的助手"升级为一支虚拟工程团队:CEO、工程经理、设计师、QA 工程师、安全官、发布工程师,23 个专家角色 + 8 个效率工具,全部通过斜杠命令调用,全部 Markdown,全部 MIT 开源免费。

核心数据

  • 60 天内写了 60 万+ 行生产代码(其中 35% 是测试)

  • 日均 1-2 万行

  • 一周 retro 数据:14 万行新增,362 次提交

  • 2026 年 GitHub 贡算:1237 次贡献(2013 年做 Bookface 时是 772 次)

一个人,一个 AI,一支团队

这就是 gstack 的核心理念。不是让 AI 写更多代码,而是让 AI 扮演正确的角色,用正确的方式,做正确的事。

1.2、为什么需要 gstack

没有 gstack 的痛点

你可能已经用过 Claude Code,但遇到过这些问题:

  1. 没有流程 — 想到哪写到哪,没有系统性的思考、规划、测试、发布流程

  2. 质量不可控 — AI 写的代码看起来能用,但边界情况、安全漏洞、UI 一致性没人检查

  3. 测试缺失 — "先跑起来再说" 成了常态,测试覆盖率长期为 0

  4. 发布混乱 — 没有 CI/CD,没有版本管理,没有自动化测试

  5. 重复劳动 — 每次都要手动检查、手动测试、手动更新文档

有 gstack 之后

阶段 没有 gstack 有 gstack
想法 直接写代码 /office-hours — 6 个强迫性问题帮你重新定义问题
规划 边写边想 /plan-ceo-review + /plan-eng-review — CEO 挑战 + 工程经理锁定架构
实现 写完就完事 写完自动跑 /review — 自动发现 CI 通过但线上会炸的 bug
测试 手动点点点 /qa — 真实浏览器打开你的 staging,自动点击、截图、修 bug、写回归测试
发布 手动 push + 发 PR /ship — 自动同步、跑测试、审计覆盖率、推代码、创建 PR
复盘 不复盘 /retro — 周级回顾,每人产出、测试健康度、成长机会

1.3、核心哲学

gstack 的设计哲学是三个原则,它们决定了所有技能的行为方式:

原则 1:煮干湖(Boil the Lake)

AI 让完整的边际成本接近零。当完整实现只比捷径多花几分钟时,做完整的事。每次都做。

传统思维:"这个方案覆盖 90% 的场景,代码更少,选它。"

gstack 思维:"完整方案比 90% 方案多 70 行代码?70 行代码 AI 写只要几秒钟。选完整的。"

实际压缩比:

任务类型 人类团队 AI 辅助 压缩比
样板/脚手架 2 天 15 分钟 ~100x
测试编写 1 天 15 分钟 ~50x
功能实现 1 周 30 分钟 ~30x
Bug 修复 + 回归测试 4 小时 15 分钟 ~20x

原则 2:先搜索再构建(Search Before Building)

千倍工程师的第一直觉不是"我来设计"而是"有人解决过吗?"

知识分三层:

  • Layer 1:经过验证的标准做法(大概率你知道,但值得确认)

  • Layer 2:新流行的最佳实践(搜索看看,但要批判性地审视)

  • Layer 3:第一性原理推导(最有价值,源于你对具体问题的独立思考)

最有价值的发现是:理解了 Layer 1 和 Layer 2 的做法,然后用 Layer 3 推翻它。

原则 3:用户主权(User Sovereignty)

AI 推荐但不决定。用户永远是对的。

即使 Claude 和 Codex 都同意某个改动更好,如果用户说"不",那就是"不"。AI 永远不应该在未经确认的情况下替用户做决定。

1.4 七步闭环⼯作流:Think → Plan → Build → Review → Test → Ship → Reflect

三⼤哲学落地到实践中,就是 GStack 的七步冲刺⼯作流。每⼀步对应⼀个阶段,每个阶段有专属

的 Skill 来执⾏。关键设计:每步的输出是下⼀步的输⼊——它们不是独⽴的⼯具,⽽是⼀条流⽔线。

这个流程的威⼒在于链式传递。举个例⼦: /office-hours 的产出(设计⽂档)会被 /plan

eng-review 读取来做架构评审;架构⽂档又会指导 Build 阶段的代码⽣成; /review 知道架构约束

所以能发现更深层的 bug; /qa 知道设计要求所以能测试正确的场景。每个⾓⾊都不是从零开始——它站在前⼀个⾓⾊的肩膀上。

1.5、快速上手

安装(30 秒)

前提:已安装 Claude Code、Git、Bun v1.0+

打开Claude coode,执行以下命令或者在git工具里执行:

git clone --single-branch --depth 1 https://github.com/garrytan/gstack.git ~/.claude/skills/gstack

cd ~/.claude/skills/gstack && ./setup

安装完成后,Claude Code 会自动识别所有 /office-hours/review 等命令。

备注:如果/skills命令能看到这些技能,但/无法看到,说明只安装了技能,只是通过自然语言触发,如使用 gstack office-hours。如果想使用/命令,需要在告诉claude,重新初始化gstack,用中文回答,希望能手动触发技能。如果不行需要手动拷贝到commands下,然后重启claude

如果想把skill识别成command,需要claude为最新版本,低版本不支持

卸载

打开Claude coode,执行以下命令或者在git工具里执行:

~/.claude/skills/gstack/bin/gstack-uninstall

团队模式(推荐)

每个开发者全局安装,更新自动同步:

打开Claude coode,执行以下命令或者在git工具里执行:

cd ~/.claude/skills/gstack && ./setup --team

然后在项目中引导,具体操作

1、路径切换到项目根目录下

2、打开Claude coode,执行以下命令或者在git工具里执行:

~/.claude/skills/gstack/bin/gstack-team-init required

git add .claude/ CLAUDE.md && git commit -m "require gstack for AI-assisted work"

第一次使用:5 个命令体验

  1. /office-hours → 描述你想做什么,让 AI 帮你重新定义问题

  2. /plan-ceo-review → 让 CEO 角色挑战你的方案

  3. /plan-eng-review → 让工程经理锁定架构和测试方案

  4. /review → 让高级工程师审查你的代码

  5. /qa → 让 QA 工程师测试你的 staging 网站

如果你做完这 5 步还觉得没用,那 gstack 确实不适合你。但大多数人到第 3 步就已经上瘾了

1.6、23 个专家角色详解

思考与规划阶段

命令 角色 做什么
/office-hours YC Office Hours 6 个强迫性问题帮你重新定义问题。不是问"你想做什么",而是挖掘你真正的痛点。输出设计文档供后续技能使用。
/plan-ceo-review CEO / 创始人 重新思考问题,找到隐藏在需求里的 10 星产品。4 种模式:扩展、选择性扩展、保持范围、缩减。
/plan-eng-review 工程经理 锁定架构、数据流、ASCII 图、边界情况、测试矩阵。把隐藏假设逼到明面上。
/plan-design-review 高级设计师 对每个设计维度打分(0-10),解释满分长什么样,然后编辑计划让它更接近满分。含 AI Slop 检测。
/plan-devex-review 开发体验负责人 探索开发者画像,对比竞品的 TTHW(Time to Hello World),设计你的"魔法时刻",逐步追踪摩擦点。

设计阶段

命令 角色 做什么
/design-consultation 设计伙伴 从零构建完整设计系统。研究行业、提出创意方向、生成逼真的产品模型图。
/design-shotgun 设计探索者 生成 4-6 个 AI 设计变体,在浏览器中并排对比,收集反馈,迭代。有品味记忆——几轮之后会偏向你喜欢的风格。
/design-html 设计工程师 把模型图变成可交付的生产级 HTML/CSS。基于 Pretext 的文本布局:文字自动重排、高度自适应。~30KB,零依赖。

构建与审查阶段

命令 角色 做什么
/review 高级工程师 找 CI 通过但线上会炸的 bug。自动修复明显问题。标记完整性缺口。
/investigate 调试专家 系统性根因调试。铁律:没有调查不修复。追踪数据流、测试假设、3 次失败后停止。
/codex 第二意见 从 OpenAI Codex CLI 获取独立代码审查。3 种模式:代码审查(通过/不通过)、对抗性挑战、开放咨询。

测试阶段

命令 角色 做什么
/qa QA 负责人 真实浏览器测试你的应用,找 bug、修 bug、写回归测试、验证修复。
/qa-only QA 报告员 同 /qa 的方法但只出报告不改代码。
/design-review 会写代码的设计师 设计层面的 QA:视觉不一致、间距问题、层级问题、AI slop 模式。原子提交,前后对比截图。
/devex-review DX 测试员 实时开发体验审计:导航文档、尝试上手流程、计时 TTHW、截图错误。

发布与运维阶段

命令 角色 做什么
/ship 发布工程师 同步 main、跑测试、审计覆盖率、推代码、创建 PR。没有测试框架?自动引导搭建。
/land-and-deploy 发布工程师 合并 PR、等 CI、部署、验证生产环境健康。从"已批准"到"生产已验证"一条命令。
/canary SRE 部署后监控循环。监控控制台错误、性能退化、页面故障。
/benchmark 性能工程师 基线化页面加载时间、Core Web Vitals、资源大小。每次 PR 对比前后差异。

文档与回顾

命令 角色 做什么
/document-release 技术文档工程师 更新所有项目文档,交叉对比 diff,保持 README/ARCHITECTURE/CONTRIBUTING/CLAUDE.md 同步。
/retro 工程经理 周级回顾。每人产出、提交频率、测试健康度趋势、成长机会。

浏览器(核心基础设施)

命令 角色 做什么
/browse QA 工程师 给 AI 一双眼睛。真实 Chromium 浏览器,真实点击,真实截图。~100ms/命令。
/open-gstack-browser GStack 浏览器 带侧边栏的可见 Chromium。反机器人隐身、自动模型路由、一键导入 Cookie。

效率工具

命令 做什么
/careful 安全护栏 — 在破坏性命令前警告(rm -rf, DROP TABLE, force-push)
/freeze 编辑锁 — 限制文件编辑到指定目录,防止调试时误改无关代码
/guard 完整安全 — /careful + /freeze 合二为一
/unfreeze 解锁 — 移除 /freeze 的目录限制
/autoplan 审查管线 — 一条命令运行 CEO → 设计 → 工程 → DX 全部审查
/learn 记忆管理 — 查看/搜索/导出 gstack 跨会话学到的项目模式
/gstack-upgrade 自更新 — 升级 gstack 到最新版本

2、典型工作流

场景 1:做一个新功能

你: 我想给网站加一个每日简报功能。

你: /office-hours

Claude: [深挖痛点,重新定义为"个人 AI 首席参谋"]

你: /plan-ceo-review

Claude: [挑战 4 个前提假设,生成 3 种实现方案]

你: /plan-eng-review

Claude: [ASCII 数据流图,边界情况,测试矩阵]

你: 批准方案,开始写代码。8 分钟写完 2400 行。

你: /review

Claude: [自动修复 2 个问题,要求你确认 1 个竞态条件]

你: /qa https://staging.myapp.com

Claude: [打开浏览器,点击流程,发现 1 个 bug 并修复,写回归测试]

你: /ship

Claude: [测试 42→51 (+9 新), PR 已创建]

场景 2:修一个线上 bug

你: /investigate

Claude: [系统性根因分析:追踪数据流,测试假设,定位根因]

你: /review

Claude: [审查你的修复,确保没有引入新问题]

你: /ship

Claude: [推代码,创建 PR]

场景 3:做设计

你: /design-consultation

Claude: [研究行业,提出设计系统,生成模型图]

你: /design-shotgun

Claude: [生成 4-6 个变体,在浏览器中对比]

你: [选一个,给反馈,迭代]

你: /design-html

Claude: [把模型图变成可交付的 HTML/CSS]


3、适用场景

最适合

  • 技术创始人/CEO — 特别是还在写代码的人

  • Claude Code 新手 — 需要结构化指导的人

  • Tech Lead / Staff 工程师 — 需要严格审查和 QA 自动化的人

  • 独立开发者 — 一个人当团队用

不太适合

  • 不使用 Claude Code 的团队(gstack 是 Claude Code 的插件)

  • 不写代码的项目(纯文档、纯运营)

  • 需要 GUI 界面交互的测试(浏览器自动化适合 Web 应用,不适合原生 App)

4、快速命令速查

我想... 用这个命令
探索产品想法 /office-hours
让 CEO 审查我的方案 /plan-ceo-review
让工程经理审查架构 /plan-eng-review
让设计师审查 UI /plan-design-review
做设计系统 /design-consultation
看设计变体对比 /design-shotgun
把设计变成 HTML /design-html
代码审查 /review
调试 bug /investigate
测试网站 /qa <URL>
只出测试报告不改代码 /qa-only <URL>
推代码 /ship
合并 PR + 部署 /land-and-deploy
安全审计 /cso
更新文档 /document-release
周回顾 /retro
查看 AI 学习了什么 /learn
升级 gstack /gstack-upgrade

5、链接

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐