claude code架构猜测总结

摘要：Claude Code架构解析 Claude Code的核心是LLM驱动的工具调用循环，其智能来源于模型自身的决策能力而非复杂调度。从v0到v4的演进展示了关键设计理念：通过外置认知结构增强模型能力。v0仅用bash工具证明基础循环的可行性；v1优化工程实现；v2引入Todo列表作为外部工作记忆；v3通过子代理实现上下文隔离；v4将知识从参数剥离到Skill文件系统。整体架构保持克制，LLM

拉普拉斯之妖44

229人浏览 · 2026-01-13 23:20:36

拉普拉斯之妖44 · 2026-01-13 23:20:36 发布

一句话总览

Claude Code 本质 =「LLM 驱动的 Tool-Calling 循环」+「逐层外置的认知结构」
模型是 Agent，本体代码只负责：约束、反馈、隔离、注入知识。

一、最底层原理：Agent Loop（不变内核）

所有版本共享同一个不可约核心：

while True:
  LLM(messages, tools)
  if 无 tool_use: 结束
  执行 tool
  tool_result → 作为新上下文反馈给 LLM

关键点：

决策权完全在模型：选什么工具、顺序、是否结束
代码是被动执行器
Claude Code 的“智能”≠复杂调度，而是 LLM 自反式决策能力

👉 这在 v0–v4 中完全一致

二、v0 → v1：能力来源不是工具数量，而是「可达性」

v0：Bash is All You Need

只有 1 个 bash 工具
通过 shell 组合能力 → 读/写/执行/递归子进程
子代理 = 进程隔离（python v0_bash_agent.py "task"）

👉 证明：
Agent ≠ 多工具系统，Agent = 自主循环 + 可执行环境

v1：4 工具是“工程最小集”

bash / read / write / edit
提供 更低 token 成本、更稳定的调用接口
但认知仍然完全在模型隐空间

👉 v1 的价值是工程化，而非架构升级

三、v2：显式认知 = 把「思考」外置成状态机

问题

模型计划存在于隐状态
长任务 → Context Fade

解决：TodoWrite

Todo 列表 = 外显的中间思考结构
约束：
- ≤20 项
- 同时仅 1 个 in_progress

本质：

Todo 不是给人看的，而是 给模型自己看的工作记忆

👉 Claude Code 开始具备 “外部工作记忆”

四、v3：子代理 = 上下文隔离，而不是多智能体

关键问题：Context Pollution

探索代码 ≠ 实施修改
混在一个 history 里 → token 被“垃圾信息”占满

Task / Subagent 机制

子代理：
- 独立 message history
- 工具白名单
- 专用 system prompt
父代理只拿到 summary

这是 进程级上下文隔离，不是 Agent 协作框架

👉 本质是 “函数调用 + 返回值”，不是自治多体

五、v4：Skills = 把「知识」从参数中剥离

核心转折点：Knowledge Externalization

传统	Claude Code
知识在模型参数	知识在 SKILL.md
训练才能新增	写文件即可
隐式、不可控	显式、可版本化

Skill 注入的关键工程点

不是 system prompt
而是通过 tool_result 注入
→ 不破坏 prompt cache（成本下降 20–50x）

Skill ≠ Tool
Tool = 能力
Skill = 操作范式 +专家流程

👉 Claude Code 的可扩展性来源于 “知识文件系统”

六、整体架构抽象（最终形态）

┌──────────────────────────────────┐
│           LLM (Agent)             │
│  - 决策 / 规划 / 反思              │
└───────────────▲──────────────────┘
                │
        tool_result (反馈)
                │
┌───────────────┴──────────────────┐
│          Agent Runtime            │
│  - Tool 执行                       │
│  - Todo 状态机                     │
│  - Task 子代理                     │
│  - Skill 注入                      │
└──────────────────────────────────┘

不变的只有一件事：

LLM 是唯一的“智能体”，其他都是外置认知器官

七、为什么这套架构有效（核心原因）

最大化利用模型已训练的 Agent 能力
把易退化的认知结构外显
通过隔离与约束降低 token 噪声
用文件系统承载“可维护知识”

所以 Claude Code 强，不是因为工程复杂，
而是 工程极度克制。

八、给你的定位算法背景的一句映射（类比）

如果类比 SLAM：

Claude Code	SLAM
LLM	后端优化器
Tools	传感器模型
Todo	状态图 / factor graph
Subagent	局部子地图
Skills	先验地图 /语义约束

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

生成式 AI：解锁数字内容创作的无限可能

扩散模型（Diffusion Models）则通过逐步去噪的过程生成高质量图像，在视觉创作领域取得突破。生成式 AI 基于深度学习模型，尤其是 Transformer 架构，通过海量数据训练获得内容生成能力。这类模型通过自注意力机制捕捉数据中的复杂模式，能够处理文本、图像、音频等多种模态。版权归属和内容真实性成为亟待解决的问题，需要建立完善的内容溯源机制。自动生成营销文案、新闻稿件、剧本小说等文字

2048 AI社区

Day 39：【99天精通Python】异步编程 (AsyncIO) 上篇 - 协程的魔法

本文介绍了Python异步编程基础，重点讲解协程概念和使用方法。主要内容包括：1) 同步与异步执行的区别，异步通过协程实现非阻塞I/O；2) 使用async/await关键字定义和运行协程，通过asyncio.run()启动事件循环；3) 利用asyncio.gather()实现并发任务；4) 常见错误如阻塞代码和忘记await；5) 协程工作原理和性能优势。文章通过早餐制作示例展示异步执行的高效