面试04-父子 Agent 实现上下文隔离

Fairy要carry

327人浏览 · 2026-03-19 22:26:22

Fairy要carry · 2026-03-19 22:26:22 发布

一、核心问题：单Agent上下文「膨胀污染」

面试官关注的核心痛点是：单 Agent 处理复杂任务时，上下文会无限膨胀且充斥冗余信息。
比如回答「这个项目用什么测试框架？」，单Agent需要读取5个文件、执行多次 bash 命令，这些文件内容、命令输出会永久留在上下文里——父任务只需要「pytest」这个结论，但上下文里全是无关的原始数据，导致：

上下文过长，模型推理变慢、易出错；
核心信息被冗余内容淹没，模型抓不住重点；
多步骤任务的上下文混乱，难以维护。

二、核心方案：父-子Agent（次级代理）架构

核心逻辑是「父Agent做规划协调，子Agent做具体执行，执行完销毁上下文，只返回摘要」，彻底解决上下文膨胀问题，先看核心架构：

父Agent（Parent）                子Agent（Sub/次级）
+------------------------+      +------------------------+
| 职责：拆分任务、汇总结果      | 职责：执行单一子任务     |
| 上下文：干净，只存核心信息    | 上下文：独立、新鲜、用完丢|
| 工具：包含「task」工具        | 工具：基础工具（bash/读写）|
|                          |      |                        |
| 1. 收到用户大任务           |      | 1. 接收父Agent的子任务  |
| 2. 调用「task」工具派生子Agent| --> | 2. 用全新空上下文执行   |
| 3. 等待子Agent返回摘要       | <-- | 3. 执行完返回最终文本摘要|
| 4. 用摘要回答用户           |      | 4. 销毁自身所有上下文    |
+------------------------+      +------------------------+

三、核心代码逻辑（上下文管理是关键）

1. 工具分层：父有「派生子任务」能力，子只有基础工具

# 子Agent的基础工具（bash/读写文件等，无递归能力）
CHILD_TOOLS = [bash_tool, read_file_tool, write_file_tool, edit_file_tool]

# 父Agent的工具 = 子工具 + task工具（核心：派生子Agent）
PARENT_TOOLS = CHILD_TOOLS + [
    {
        "name": "task",
        "description": "Spawn a subagent with fresh context.",  # 生成新上下文的子Agent
        "input_schema": {
            "type": "object",
            "properties": {"prompt": {"type": "string"}},  # 传给子Agent的子任务指令
            "required": ["prompt"],
        }
    },
]

子Agent 没有「task」工具 ：避免无限递归派生子 Agent ；
父Agent 独有「task」工具 ：唯一能触发子 Agent 的入口，保证层级可控。

2. 子Agent执行函数（核心：独立上下文+用完销毁）

SUBAGENT_SYSTEM = f"You are a coding subagent at {WORKDIR}. Complete the given task, then summarize your findings."

def run_subagent(prompt: str) -> str:
    # 1 子Agent的上下文是全新空列表，和父Agent完全隔离
    sub_messages = [{"role": "user", "content": prompt}]
    
    # 安全限制：最多执行30轮工具调用，防止死循环 （while->for）
    for _ in range(30):
        # 2 调用模型：用子Agent的独立上下文、子工具集
        response = client.messages.create(
            model=MODEL, 
            system=SUBAGENT_SYSTEM,  # 子Agent的专属系统提示（更聚焦执行）
            messages=sub_messages,   # 子Agent的独立上下文，和父无关
            tools=CHILD_TOOLS,       # 只有基础工具，不能派生新子Agent
            max_tokens=8000,
        )
        # 3 子Agent的上下文更新（只在自己的列表里加，不影响父）
        sub_messages.append({"role": "assistant", "content": response.content})
        
        # 4 如果子Agent完成任务（不需要再调用工具），终止循环
        if response.stop_reason != "tool_use":
            break
        
        # 5 执行子Agent调用的工具（bash/读写等）
        results = []
        for block in response.content:
            if block.type == "tool_use":
                handler = TOOL_HANDLERS.get(block.name)
                output = handler(**block.input)
                results.append({
                    "type": "tool_result",
                    "tool_use_id": block.id,
                    "content": str(output)[:50000]  # 子Agent的原始输出（只在自己上下文里）
                })
        # 6 工具结果加入子Agent的独立上下文
        sub_messages.append({"role": "user", "content": results})
    
    # 7 子Agent只返回最终文本摘要，丢弃所有中间上下文
    return "".join(b.text for b in response.content if hasattr(b, "text")) or "(no summary)"

上下文管理核心点：

父子 Agent 是如何管理的？： sub_messages 是子 Agent 的独立上下文，从空列表开始，和父Agent的 messages 完全隔离；
子 Agent 的工具调用和原始输出在哪？： 子 Agent 执行过程中，所有工具调用、原始输出都只存在于 sub_messages 中；
子 Agent 返回给父 Agent 的内容是什么？： 执行完成后，只返回「最终文本摘要」给父Agent，sub_messages 被销毁（函数执行完局部变量释放），父上下文里只有摘要，没有冗余原始数据。

3. 父 Agent 调用子 Agent 的逻辑

父 Agent 收到用户的复杂任务后，会：

决定拆分出子任务（比如「检查项目测试框架」）；
调用「task」工具，传入子任务 prompt ；
执行 run_subagent(prompt)，得到子Agent返回的摘要（比如「pytest」）；
把这个摘要加入自己的上下文，继续处理其他子任务；
最终用所有子任务的摘要汇总，回答用户。

四、面试官最关心的「上下文管理」核心要点

隔离性：父、子Agent的上下文完全独立，子Agent的上下文是「新鲜空列表」，不会继承父的冗余信息；
销毁机制：子Agent执行完子任务后，其所有中间上下文（文件内容、bash输出等）全部销毁，只返回摘要，父上下文只保留核心结论；
层级可控：只有父Agent能派生子Agent，子Agent没有「task」工具，避免无限递归；
轻量化：父Agent的上下文始终「干净」，只存任务拆分、子任务摘要等核心信息，解决单Agent上下文膨胀的问题。

五、举例理解（面试能直接说的场景）

用户问：「构建登录功能并写测试，告诉我用了什么测试框架，测试是否通过」。

父Agent拆分2个子任务：① 构建登录功能；② 编写并执行测试，确认测试框架和结果；
父Agent调用「task」工具，给子Agent1传prompt「构建登录功能」，子Agent1 用 全新上下文 执行（创建文件、写代码），返回摘要「登录功能已构建，文件路径：login.py」；
父Agent再调用「task」工具，给子Agent2传prompt「测试login.py，确认用的测试框架和测试结果」，子Agent2 用 全新上下文 执行（读取文件、执行pytest命令、查看输出），返回摘要「测试框架：pytest，测试通过，共2个用例」；
父Agent 汇总两个摘要，回答用户，其上下文里只有「子任务1摘要+子任务2摘要」，没有子Agent执行过程中读取的文件内容、bash输出等冗余信息。

总结（面试答法）

多Agent的上下文管理核心是「分层隔离 + 用完销毁 + 只传摘要」：

父Agent做任务拆分和结果汇总，上下文只保留核心信息，保证轻量化；
子Agent处理单一子任务，使用独立的全新上下文，避免父上下文被冗余数据污染；
子Agent执行完后销毁自身所有中间上下文，只返回摘要给父Agent，从根本上解决单Agent上下文膨胀、信息冗余的问题。

这种架构的优势是上下文清晰、模型推理效率高，尤其适合复杂、多步骤的任务，这也是面试官关注的核心——你要能说清「隔离」「销毁」「摘要」这三个关键词，以及它们如何解决上下文管理的痛点。

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

MCP 的三种数据传输模式教程（stdio / SSE / Streamable HTTP）

本文介绍了MCP协议的三种数据传输模式：stdio、旧版HTTP+SSE和推荐的streamable-http。stdio适用于本地单机场景，通过标准输入输出通信；旧版HTTP+SSE已废弃，仅用于兼容历史系统；streamable-http是当前远程服务的标准方案，支持单端点JSON或SSE响应。文章详细对比了三种模式的优缺点，提供了选型建议和迁移指南，强调新项目应优先使用stdio或strea

2048 AI社区

拒绝 API 割韭菜！算家云+OpenClaw+本地模型，批量任务成本立降 90% ！

2048 AI社区

Visual Studio —— 为现代开发的速度而打造

Visual Studio 如今正以现代软件的速度进行创新。无论您是开发桌面应用、云服务、游戏、Web API 还是 AI 智能体，这款 IDE 现在每月都会推出最新的性能和功能改进，且 GitHub Copilot 的使用体验也始终保持更新。我们也听到了对无阻碍更新的需求。您现有的项目、解决方案和扩展将继续像现在这样正常运行。我们在月度和年度版本中保持着较高的兼容性标准，因此在 IDE 不断演进