1人公司最佳工具-GStack
GStack架构全景:23个Skill的虚拟团队工作流 GStack是YC CEO Garry Tan开源的一套ClaudeCode增强技能集,将AI助手升级为包含23个专业角色的虚拟工程团队。核心功能包括: 全流程覆盖:从需求定义(/office-hours)到架构评审(/plan-eng-review)、代码审查(/review)、QA测试(/qa)和发布(/ship),形成完整闭环。 角色分
1、GStack 架构全景:23 个 Skill 的虚拟公司

1.1、gstack 是什么
gstack 是 Y Combinator CEO Garry Tan 开源的一套 Claude Code 工作流技能集。它把 Claude Code 从一个"会写代码的助手"升级为一支虚拟工程团队:CEO、工程经理、设计师、QA 工程师、安全官、发布工程师,23 个专家角色 + 8 个效率工具,全部通过斜杠命令调用,全部 Markdown,全部 MIT 开源免费。
核心数据
-
60 天内写了 60 万+ 行生产代码(其中 35% 是测试)
-
日均 1-2 万行
-
一周 retro 数据:14 万行新增,362 次提交
-
2026 年 GitHub 贡算:1237 次贡献(2013 年做 Bookface 时是 772 次)
一个人,一个 AI,一支团队
这就是 gstack 的核心理念。不是让 AI 写更多代码,而是让 AI 扮演正确的角色,用正确的方式,做正确的事。
1.2、为什么需要 gstack
没有 gstack 的痛点
你可能已经用过 Claude Code,但遇到过这些问题:
-
没有流程 — 想到哪写到哪,没有系统性的思考、规划、测试、发布流程
-
质量不可控 — AI 写的代码看起来能用,但边界情况、安全漏洞、UI 一致性没人检查
-
测试缺失 — "先跑起来再说" 成了常态,测试覆盖率长期为 0
-
发布混乱 — 没有 CI/CD,没有版本管理,没有自动化测试
-
重复劳动 — 每次都要手动检查、手动测试、手动更新文档
有 gstack 之后
| 阶段 | 没有 gstack | 有 gstack |
| 想法 | 直接写代码 | /office-hours — 6 个强迫性问题帮你重新定义问题 |
| 规划 | 边写边想 | /plan-ceo-review + /plan-eng-review — CEO 挑战 + 工程经理锁定架构 |
| 实现 | 写完就完事 | 写完自动跑 /review — 自动发现 CI 通过但线上会炸的 bug |
| 测试 | 手动点点点 | /qa — 真实浏览器打开你的 staging,自动点击、截图、修 bug、写回归测试 |
| 发布 | 手动 push + 发 PR | /ship — 自动同步、跑测试、审计覆盖率、推代码、创建 PR |
| 复盘 | 不复盘 | /retro — 周级回顾,每人产出、测试健康度、成长机会 |
1.3、核心哲学
gstack 的设计哲学是三个原则,它们决定了所有技能的行为方式:
原则 1:煮干湖(Boil the Lake)
AI 让完整的边际成本接近零。当完整实现只比捷径多花几分钟时,做完整的事。每次都做。
传统思维:"这个方案覆盖 90% 的场景,代码更少,选它。"
gstack 思维:"完整方案比 90% 方案多 70 行代码?70 行代码 AI 写只要几秒钟。选完整的。"
实际压缩比:
| 任务类型 | 人类团队 | AI 辅助 | 压缩比 |
| 样板/脚手架 | 2 天 | 15 分钟 | ~100x |
| 测试编写 | 1 天 | 15 分钟 | ~50x |
| 功能实现 | 1 周 | 30 分钟 | ~30x |
| Bug 修复 + 回归测试 | 4 小时 | 15 分钟 | ~20x |
原则 2:先搜索再构建(Search Before Building)
千倍工程师的第一直觉不是"我来设计"而是"有人解决过吗?"
知识分三层:
-
Layer 1:经过验证的标准做法(大概率你知道,但值得确认)
-
Layer 2:新流行的最佳实践(搜索看看,但要批判性地审视)
-
Layer 3:第一性原理推导(最有价值,源于你对具体问题的独立思考)
最有价值的发现是:理解了 Layer 1 和 Layer 2 的做法,然后用 Layer 3 推翻它。
原则 3:用户主权(User Sovereignty)
AI 推荐但不决定。用户永远是对的。
即使 Claude 和 Codex 都同意某个改动更好,如果用户说"不",那就是"不"。AI 永远不应该在未经确认的情况下替用户做决定。
1.4 七步闭环⼯作流:Think → Plan → Build → Review → Test → Ship → Reflect
三⼤哲学落地到实践中,就是 GStack 的七步冲刺⼯作流。每⼀步对应⼀个阶段,每个阶段有专属
的 Skill 来执⾏。关键设计:每步的输出是下⼀步的输⼊——它们不是独⽴的⼯具,⽽是⼀条流⽔线。


这个流程的威⼒在于链式传递。举个例⼦: /office-hours 的产出(设计⽂档)会被 /plan
eng-review 读取来做架构评审;架构⽂档又会指导 Build 阶段的代码⽣成; /review 知道架构约束
所以能发现更深层的 bug; /qa 知道设计要求所以能测试正确的场景。每个⾓⾊都不是从零开始——它站在前⼀个⾓⾊的肩膀上。
1.5、快速上手
安装(30 秒)
前提:已安装 Claude Code、Git、Bun v1.0+
打开Claude coode,执行以下命令或者在git工具里执行:
git clone --single-branch --depth 1 https://github.com/garrytan/gstack.git ~/.claude/skills/gstack
cd ~/.claude/skills/gstack && ./setup
安装完成后,Claude Code 会自动识别所有 /office-hours、/review 等命令。
备注:如果/skills命令能看到这些技能,但/无法看到,说明只安装了技能,只是通过自然语言触发,如使用 gstack office-hours。如果想使用/命令,需要在告诉claude,重新初始化gstack,用中文回答,希望能手动触发技能。如果不行需要手动拷贝到commands下,然后重启claude
如果想把skill识别成command,需要claude为最新版本,低版本不支持
卸载
打开Claude coode,执行以下命令或者在git工具里执行:
~/.claude/skills/gstack/bin/gstack-uninstall
团队模式(推荐)
每个开发者全局安装,更新自动同步:
打开Claude coode,执行以下命令或者在git工具里执行:
cd ~/.claude/skills/gstack && ./setup --team
然后在项目中引导,具体操作
1、路径切换到项目根目录下
2、打开Claude coode,执行以下命令或者在git工具里执行:
~/.claude/skills/gstack/bin/gstack-team-init required
git add .claude/ CLAUDE.md && git commit -m "require gstack for AI-assisted work"
第一次使用:5 个命令体验
-
/office-hours → 描述你想做什么,让 AI 帮你重新定义问题
-
/plan-ceo-review → 让 CEO 角色挑战你的方案
-
/plan-eng-review → 让工程经理锁定架构和测试方案
-
/review → 让高级工程师审查你的代码
-
/qa → 让 QA 工程师测试你的 staging 网站
如果你做完这 5 步还觉得没用,那 gstack 确实不适合你。但大多数人到第 3 步就已经上瘾了
1.6、23 个专家角色详解
思考与规划阶段
| 命令 | 角色 | 做什么 |
| /office-hours | YC Office Hours | 6 个强迫性问题帮你重新定义问题。不是问"你想做什么",而是挖掘你真正的痛点。输出设计文档供后续技能使用。 |
| /plan-ceo-review | CEO / 创始人 | 重新思考问题,找到隐藏在需求里的 10 星产品。4 种模式:扩展、选择性扩展、保持范围、缩减。 |
| /plan-eng-review | 工程经理 | 锁定架构、数据流、ASCII 图、边界情况、测试矩阵。把隐藏假设逼到明面上。 |
| /plan-design-review | 高级设计师 | 对每个设计维度打分(0-10),解释满分长什么样,然后编辑计划让它更接近满分。含 AI Slop 检测。 |
| /plan-devex-review | 开发体验负责人 | 探索开发者画像,对比竞品的 TTHW(Time to Hello World),设计你的"魔法时刻",逐步追踪摩擦点。 |
设计阶段
| 命令 | 角色 | 做什么 |
| /design-consultation | 设计伙伴 | 从零构建完整设计系统。研究行业、提出创意方向、生成逼真的产品模型图。 |
| /design-shotgun | 设计探索者 | 生成 4-6 个 AI 设计变体,在浏览器中并排对比,收集反馈,迭代。有品味记忆——几轮之后会偏向你喜欢的风格。 |
| /design-html | 设计工程师 | 把模型图变成可交付的生产级 HTML/CSS。基于 Pretext 的文本布局:文字自动重排、高度自适应。~30KB,零依赖。 |
构建与审查阶段
| 命令 | 角色 | 做什么 |
| /review | 高级工程师 | 找 CI 通过但线上会炸的 bug。自动修复明显问题。标记完整性缺口。 |
| /investigate | 调试专家 | 系统性根因调试。铁律:没有调查不修复。追踪数据流、测试假设、3 次失败后停止。 |
| /codex | 第二意见 | 从 OpenAI Codex CLI 获取独立代码审查。3 种模式:代码审查(通过/不通过)、对抗性挑战、开放咨询。 |
测试阶段
| 命令 | 角色 | 做什么 |
| /qa | QA 负责人 | 真实浏览器测试你的应用,找 bug、修 bug、写回归测试、验证修复。 |
| /qa-only | QA 报告员 | 同 /qa 的方法但只出报告不改代码。 |
| /design-review | 会写代码的设计师 | 设计层面的 QA:视觉不一致、间距问题、层级问题、AI slop 模式。原子提交,前后对比截图。 |
| /devex-review | DX 测试员 | 实时开发体验审计:导航文档、尝试上手流程、计时 TTHW、截图错误。 |
发布与运维阶段
| 命令 | 角色 | 做什么 |
| /ship | 发布工程师 | 同步 main、跑测试、审计覆盖率、推代码、创建 PR。没有测试框架?自动引导搭建。 |
| /land-and-deploy | 发布工程师 | 合并 PR、等 CI、部署、验证生产环境健康。从"已批准"到"生产已验证"一条命令。 |
| /canary | SRE | 部署后监控循环。监控控制台错误、性能退化、页面故障。 |
| /benchmark | 性能工程师 | 基线化页面加载时间、Core Web Vitals、资源大小。每次 PR 对比前后差异。 |
文档与回顾
| 命令 | 角色 | 做什么 |
| /document-release | 技术文档工程师 | 更新所有项目文档,交叉对比 diff,保持 README/ARCHITECTURE/CONTRIBUTING/CLAUDE.md 同步。 |
| /retro | 工程经理 | 周级回顾。每人产出、提交频率、测试健康度趋势、成长机会。 |
浏览器(核心基础设施)
| 命令 | 角色 | 做什么 |
| /browse | QA 工程师 | 给 AI 一双眼睛。真实 Chromium 浏览器,真实点击,真实截图。~100ms/命令。 |
| /open-gstack-browser | GStack 浏览器 | 带侧边栏的可见 Chromium。反机器人隐身、自动模型路由、一键导入 Cookie。 |
效率工具
| 命令 | 做什么 |
| /careful | 安全护栏 — 在破坏性命令前警告(rm -rf, DROP TABLE, force-push) |
| /freeze | 编辑锁 — 限制文件编辑到指定目录,防止调试时误改无关代码 |
| /guard | 完整安全 — /careful + /freeze 合二为一 |
| /unfreeze | 解锁 — 移除 /freeze 的目录限制 |
| /autoplan | 审查管线 — 一条命令运行 CEO → 设计 → 工程 → DX 全部审查 |
| /learn | 记忆管理 — 查看/搜索/导出 gstack 跨会话学到的项目模式 |
| /gstack-upgrade | 自更新 — 升级 gstack 到最新版本 |
2、典型工作流
场景 1:做一个新功能
你: 我想给网站加一个每日简报功能。
你: /office-hours
Claude: [深挖痛点,重新定义为"个人 AI 首席参谋"]
你: /plan-ceo-review
Claude: [挑战 4 个前提假设,生成 3 种实现方案]
你: /plan-eng-review
Claude: [ASCII 数据流图,边界情况,测试矩阵]
你: 批准方案,开始写代码。8 分钟写完 2400 行。
你: /review
Claude: [自动修复 2 个问题,要求你确认 1 个竞态条件]
你: /qa https://staging.myapp.com
Claude: [打开浏览器,点击流程,发现 1 个 bug 并修复,写回归测试]
你: /ship
Claude: [测试 42→51 (+9 新), PR 已创建]
场景 2:修一个线上 bug
你: /investigate
Claude: [系统性根因分析:追踪数据流,测试假设,定位根因]
你: /review
Claude: [审查你的修复,确保没有引入新问题]
你: /ship
Claude: [推代码,创建 PR]
场景 3:做设计
你: /design-consultation
Claude: [研究行业,提出设计系统,生成模型图]
你: /design-shotgun
Claude: [生成 4-6 个变体,在浏览器中对比]
你: [选一个,给反馈,迭代]
你: /design-html
Claude: [把模型图变成可交付的 HTML/CSS]
3、适用场景
最适合
-
技术创始人/CEO — 特别是还在写代码的人
-
Claude Code 新手 — 需要结构化指导的人
-
Tech Lead / Staff 工程师 — 需要严格审查和 QA 自动化的人
-
独立开发者 — 一个人当团队用
不太适合
-
不使用 Claude Code 的团队(gstack 是 Claude Code 的插件)
-
不写代码的项目(纯文档、纯运营)
-
需要 GUI 界面交互的测试(浏览器自动化适合 Web 应用,不适合原生 App)
4、快速命令速查
| 我想... | 用这个命令 |
| 探索产品想法 | /office-hours |
| 让 CEO 审查我的方案 | /plan-ceo-review |
| 让工程经理审查架构 | /plan-eng-review |
| 让设计师审查 UI | /plan-design-review |
| 做设计系统 | /design-consultation |
| 看设计变体对比 | /design-shotgun |
| 把设计变成 HTML | /design-html |
| 代码审查 | /review |
| 调试 bug | /investigate |
| 测试网站 | /qa <URL> |
| 只出测试报告不改代码 | /qa-only <URL> |
| 推代码 | /ship |
| 合并 PR + 部署 | /land-and-deploy |
| 安全审计 | /cso |
| 更新文档 | /document-release |
| 周回顾 | /retro |
| 查看 AI 学习了什么 | /learn |
| 升级 gstack | /gstack-upgrade |
5、链接
-
许可证: MIT
更多推荐


所有评论(0)