OpenAI Assistants API

tools：配置助手可调用的工具列表，内置工具包括 code_interpreter（代码执行）、retrieval（知识库检索）、function_calling（自定义函数调用）。提交工具调用结果：当 Run 处于 requires_action 时，调用 submit_tool_outputs_to_run 提交工具执行结果，让助手继续生成回复。特殊消息类型：当助手调用工具时，会生成包含 t

qq_36073236

244人浏览 · 2026-01-20 18:55:59

qq_36073236 · 2026-01-20 18:55:59 发布

OpenAI Assistants API 是用于构建智能助手应用的核心接口，其设计目标是让开发者快速实现具备复杂能力（如知识库检索、代码执行、工具调用）的 AI 助手。以下是它的核心组成部分和关键概念，结合使用逻辑和实操场景拆解：
一、核心组成部分

Assistant（助手）
定义：这是 API 的核心实体，代表一个具备特定能力、指令和工具配置的智能助手。
核心配置项
model：指定底层大模型，如 gpt-4-turbo、gpt-3.5-turbo-1106（需支持工具调用能力）。
instructions：对助手的角色和行为的长期指令，例如 “你是一个 Python 代码调试助手，需严格按照 PEP8 规范给出修改建议”。
tools：配置助手可调用的工具列表，内置工具包括 code_interpreter（代码执行）、retrieval（知识库检索）、function_calling（自定义函数调用）。
temperature：控制输出随机性，0 表示确定性输出，1 表示高随机性。
作用：相当于助手的 “大脑”，决定了它的能力边界和行为模式。
Thread（对话线程）
定义：代表一次独立的对话会话，用于存储对话上下文和工具调用记录。
核心特性
自动管理上下文：无需开发者手动拼接历史消息，Thread 会维护完整的对话流（用户消息 + 助手回复 + 工具调用结果）。
多轮对话支持：即使是长对话，也可以通过 Thread ID 继续会话，避免上下文丢失。
作用：隔离不同用户的对话，确保会话的独立性和上下文连续性。
Thread 的状态
Message（消息）
定义：Thread 中的基本单元，分为用户消息和助手消息两类。
核心属性
role：消息发送者角色，可选值为 user（用户）、assistant（助手）、system（系统，较少用）。
content：消息内容，支持纯文本或文件引用（搭配 retrieval 工具时）。
file_ids：关联的文件 ID 列表（用于让助手读取指定文件内容）。
特殊消息类型：当助手调用工具时，会生成包含 tool_calls 字段的 assistant 消息，记录工具调用的参数和状态。
Run（运行）
定义：触发助手基于当前 Thread 上下文生成回复的执行过程，是连接 Assistant 和 Thread 的关键操作。
核心生命周期状态

关键操作
创建 Run：create_run(assistant_id, thread_id) 触发助手思考。
轮询 Run 状态：通过 retrieve_run(run_id, thread_id) 获取状态，处理 requires_action 状态。
提交工具调用结果：当 Run 处于 requires_action 时，调用 submit_tool_outputs_to_run 提交工具执行结果，让助手继续生成回复。
5. Tool（工具）
定义：扩展助手能力的外部组件，分为内置工具和自定义工具。
内置工具
code_interpreter：让助手运行 Python 代码，支持数据计算、图表生成、文件读写（沙箱环境）。
retrieval：知识库检索工具，助手可读取开发者上传的文件（PDF、TXT、CSV 等），基于文件内容回答问题。
function_calling：自定义函数调用，开发者定义函数（如查询天气、调用数据库），助手根据需求自动触发调用。
自定义工具：通过 functions 参数定义函数的名称、参数、描述，需开发者自行实现函数的执行逻辑。
6. File（文件）
定义：用于支持 retrieval 和 code_interpreter 工具的资源文件，需先通过 Files API 上传到 OpenAI 服务器。
支持格式：TXT、PDF、CSV、JSON 等常见格式。
核心属性：file_id（文件唯一标识），需在 Message 或 Assistant 中关联此 ID。
二、关键概念与工作流

核心工作流（一次完整对话）
创建 Assistant：配置模型、指令、工具（如启用 code_interpreter）。
创建 Thread：初始化一个空的对话线程。
添加 Message：向 Thread 中添加用户消息（如 “用 Python 画一个正弦函数图像”）。
创建 Run：触发 Assistant 处理当前 Thread 上下文。
处理 Run 状态
若状态为 completed：直接获取助手的回复（包含生成的代码和图表链接）。
若状态为 requires_action：执行工具调用（如运行 Python 代码），提交结果后继续轮询 Run 状态。
后续对话：重复步骤 3-5，Thread 会自动维护历史上下文。
上下文管理
Assistants API 与普通 Chat Completions API 的核心区别在于自动上下文管理：开发者无需手动拼接历史消息，Thread 会自动存储所有对话和工具调用记录，大幅简化长对话开发。
工具调用的核心逻辑
当 Assistant 判定需要工具辅助才能回答问题时，Run 会进入 requires_action 状态，返回 tool_calls 列表（包含工具类型、参数）。
开发者需解析 tool_calls，执行对应的操作（如运行代码、调用自定义函数），然后通过 submit_tool_outputs_to_run 将结果提交给 API。
助手接收工具执行结果后，会生成最终的自然语言回复。
三、典型应用场景
代码助手：启用 code_interpreter，实现代码生成、调试、数据可视化。
知识库问答：启用 retrieval，上传产品手册、文档，构建智能客服。
多工具协作助手：同时启用 function_calling 和 retrieval，实现 “检索数据 + 调用接口 + 生成报告” 的复杂流程。