引言

“我认为自己大概从去年12月以来就没怎么亲手敲过代码了,这真的是一个巨大的转变。” —— Andrej Karpathy,2026年3月

当 Karpathy 说出这番话时,我想知道他是如何做到的。一个人如何能够以二十个人的速度交付产品?Peter Steinberger 通过 AI Agent 构建了拥有 24.7 万 GitHub stars 的 OpenClaw。革命已经到来——一个拥有正确工具的独立开发者,可以比传统团队移动得更快。

我是 Garry Tan,Y Combinator 的总裁兼 CEO。我与数千家初创公司合作过——Coinbase、Instacart、Rippling——当他们还只是车库里的一两个人时。在 YC 之前,我是 Palantir 最早的工程师和产品经理之一,联合创办了 Posterous(出售给 Twitter),并构建了 YC 的内部社交网络 Bookface。

gstack 就是我的答案。 我从事产品开发二十年,但现在我交付的产品比以往任何时候都多。过去 60 天:3 个生产服务、40 多项已交付功能、兼职、在全职运营 YC 的同时。按照逻辑代码变更(不是原始 LOC,AI 会膨胀)计算,我 2026 年的年化速率是我 2013 年速度的 约 810 倍(11,417 vs 14 逻辑行/天)。截至 4 月 18 日,2026 年已经产生了 240 倍于 2013 年全年 的产出。

gstack 是什么

gstack 是一个将 Claude Code 转变为虚拟工程团队的工具体系。它包含 23 个专业工具和 8 个强大实用工具,全部通过斜杠命令调用,全部使用 Markdown 格式,全部免费,采用 MIT 许可证。

gstack 的核心理念: Think → Plan → Build → Review → Test → Ship → Reflect

每个技能都连接到下一个流程。/office-hours 编写的设计文档会流入 /plan-ceo-review/plan-eng-review 编写的测试计划会被 /qa 接收;/review 捕获的 bug 会被 /ship 验证是否已修复。没有任何东西会被遗漏,因为每个步骤都知道之前发生了什么。

核心技能详解

产品规划阶段

技能 角色定位 功能描述
/office-hours YC 办公室小时 开始的地方。六个强制问题,在写代码之前重新定义你的产品。挑战你的框架,挑战前提假设,产生实现替代方案。
/plan-ceo-review CEO / 创始人 重新思考问题。找到隐藏在请求中的 10 星产品。四种模式:扩展、选择性扩展、保持范围、缩减。
/plan-eng-review 工程经理 锁定架构、数据流、图表、边缘情况和测试。强迫隐藏的假设浮出水面。
/plan-design-review 高级设计师 给每个设计维度打分 0-10,解释 10 分是什么样子的,然后编辑计划以达到目标。AI 垃圾检测。交互式——每个设计选择一次问答。

构建与测试阶段

技能 角色定位 功能描述
/review 高级工程师 找到通过 CI 但在生产中爆炸的 bug。自动修复明显的问题。标记完整性差距。
/investigate 调试专家 系统性根因调试。铁律:没有调查就没有修复。追踪数据流,测试假设,3 次失败修复后停止。
/design-review 会设计的设计师 与 /plan-design-review 相同的审计,然后修复发现的问题。原子提交,前后截图。
/devex-review DX 测试员 实时开发者体验审计。实际测试你的入职流程:导航文档,尝试入门流程,计时 TTHW,截图错误。
/qa QA 负责人 测试你的应用,找到 bug,用原子提交修复它们,重新验证。为每个修复自动生成回归测试。
/browse QA 工程师 给 Agent 眼睛。真正的 Chromium 浏览器,真正的点击,真正的截图。每个命令约 100ms。

设计与原型阶段

技能 角色定位 功能描述
/design-consultation 设计合作伙伴 从零开始构建完整的设计系统。研究领域,提出创意风险,生成逼真的产品模型。
/design-shotgun 设计探索者 "给我看看选项"。使用 GPT Image 生成 4-6 个 AI 模型变体,在浏览器中打开比较板,收集反馈,并迭代。品味记忆了解你喜欢什么。
/design-html 设计工程师 将模型变成可投入生产的 HTML。使用 Pretext 计算文本布局:文本在调整大小时实际流动,高度适应内容,布局是动态的。30KB,零依赖。检测 React/Svelte/Vue。

发布与监控阶段

技能 角色定位 功能描述
/ship 发布工程师 同步 main,运行测试,审计覆盖率,推送,打开 PR。如果没有测试框架则引导启动。
/land-and-deploy 发布工程师 合并 PR,等待 CI 和部署,验证生产健康。一个命令从“已批准”到“已在生产中验证”。
/canary SRE 部署后监控循环。监视控制台错误、性能回归和页面失败。
/benchmark 性能工程师 基线页面加载时间、Core Web Vitals 和资源大小。在每个 PR 上比较前后。
/document-release 技术写作者 更新所有项目文档以匹配你刚刚交付的内容。自动捕获过时的 README。
/retro 工程经理 团队感知的每周回顾。每个人细分类、交付 streaks、测试健康趋势、成长机会。

安全与实用工具

技能 功能描述
/cso OWASP Top 10 + STRIDE 威胁模型。零噪音:17 个误报排除,8/10+ 置信度门控,每个发现包括具体利用场景。
/codex 从 OpenAI Codex CLI 获得独立代码审查。三种模式:审查(通过/失败门控)、对抗性挑战、开放咨询。
/careful 安全护栏——在破坏性命令之前警告(rm -rf、DROP TABLE、force-push)。
/freeze 编辑锁——将文件编辑限制在一个目录。防止在调试时意外更改范围外的代码。
/guard 完整安全——一个命令激活 /careful + /freeze

快速开始

要求: Claude Code、Git、Bun v1.0+、Node.js(仅 Windows)

安装步骤

第一步:在你的机器上安装

打开 Claude Code 并粘贴以下内容:

Install gstack: run `git clone --single-branch --depth 1 https://github.com/garrytan/gstack.git ~/.claude/skills/gstack && cd ~/.claude/skills/gstack && ./setup` then add a "gstack" section to CLAUDE.md that says to use the /browse skill from gstack for all web browsing, never use mcp__claude-in-chrome__* tools, and lists the available skills...

第二步:团队模式——共享仓库的自动更新(推荐)

(cd ~/.claude/skills/gstack && ./setup --team) && ~/.claude/skills/gstack/bin/gstack-team-init required && git add .claude/ CLAUDE.md && git commit -m "require gstack for AI-assisted work"

立即体验

你:    我想建一个日历的每日简报应用。
你:    /office-hours
Claude:[询问痛点——具体的例子,不是假设]
你:    多个 Google 日历,信息过时的活动,错误的位置...
Claude:我将挑战这个框架。你说“每日简报应用”,但你实际描述的是一个个人首席运营官 AI。
        [提取你未曾意识到的 5 个能力]
        [挑战 4 个前提——你同意、不同意或调整]
        [生成 3 个实现方案及工作量估算]
你:    /review
        [AUTO-FIXED] 2 个问题。[ASK] 竞态条件 → 你批准修复。
你:    /qa https://staging.myapp.com
        [打开真正的浏览器,点击流程,找到并修复一个 bug]
你:    /ship
        测试:42 → 51(+9 新)。PR: github.com/you/app/pull/42

gstack 的独特优势

1. 远超传统团队的产出

Garry Tan 的 2026 年运行率是其 2013 年速度的约 810 倍。在过去 60 天内,他交付了 3 个生产服务、40 多项功能,同时兼职运营 YC。GitHub 贡献图显示,2026 年(1,237 次贡献)远超 2013 年(772 次贡献)。

2. 多 AI 协作

gstack 不仅限于 Claude Code。它支持 10 个 AI 编码 Agent:

  • OpenAI Codex CLI

  • OpenCode

  • Cursor

  • Factory Droid

  • Slate

  • Kiro

  • Hermes

  • GBrain

3. 真正的浏览器自动化

/browse 技能提供持久的无头 Chromium 浏览器。第一次调用自动启动(约 3 秒),之后每个命令约 100-200ms。状态在调用之间保持(cookies、标签页、会话)。

4. 跨机器记忆

通过 GBrain Sync,gstack 累积的项目学习、设计文档、回顾等状态可以同步到私有 GitHub 仓库,在不同机器间保持一致。

适用人群

人群 价值定位
创始人和 CEO 特别是仍想交付的技术型创始人
首次使用 Claude Code 的用户 结构化角色替代空白提示
技术负责人和资深工程师 每个 PR 上的严格审查、QA 和发布自动化

与 Karpathy 失败模式的对比

Andrej Karpathy 的 AI 编码规则涵盖了四个失败模式:错误假设、过度复杂、正交编辑、命令式优于声明式。gstack 的工作流技能强制执行所有四个方面:

  • /office-hours 在写代码之前强制假设浮出水面

  • 困惑协议阻止 Claude 在架构决策上猜测

  • /review 捕获不必要的复杂性和顺便编辑

  • /ship 将任务转化为可验证的目标,测试优先执行

结语

gstack 是一个 MIT 许可证的开源软件工厂,Garry Tan 每天都在使用它。他开源分享是因为这些工具应该对每个人都可用。

免费,MIT 许可,开源。 没有高级版,没有等待名单。

fork 它,改进它,让它成为你自己的。


仓库地址: https://github.com/garrytan/gstack


Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐