【AI】DeepResearch 与 DeerFlow 的比较分析报告-初探DeepResearch

本文粗浅对比了阿里巴巴的Tongyi DeepResearch和字节跳动的DeerFlow两大深度研究代理框架。

非晓为骁

560人浏览 · 2025-09-22 10:29:40

非晓为骁 · 2025-09-22 10:29:40 发布

引言

本文对两大深度研究代理框架进行了系统性比较：阿里巴巴 NLP 团队的 Tongyi DeepResearch 与字节跳动的 DeerFlow。二者均致力于利用大语言模型（LLMs）和多样化工具，实现研究过程的自动化与增强。虽然目标相似，但在体系架构、核心功能、训练方法及成果输出方面，两者展现出截然不同的思路与优势。

一、项目概览

1.1 Tongyi DeepResearch

开发团队：阿里巴巴 NLP · 通义实验室
核心定位：面向长周期、深层次信息检索任务的代理式大语言模型框架。其目标是通过先进的 LLM 能力与高效的数据合成技术，在代理式搜索基准中实现最前沿的表现。

1.2 DeerFlow

开发团队：字节跳动
核心定位：DeerFlow（Deep Exploration and Efficient Research Flow，深度探索与高效研究流程）是一个社区驱动的多代理研究框架。它融合语言模型与多种工具（网络搜索、爬虫、代码执行、语音合成等），旨在实现从信息收集到多模态成果生成的全流程自动化。

二、架构与技术差异

2.1 模型与核心技术

Tongyi DeepResearch

规模与效率：拥有 305 亿参数，采用稀疏激活机制（每个 token 仅激活 33 亿参数），兼顾算力与性能。
训练体系：通过自动化合成数据管道（AgentFounder），实施持续预训练（CPT）、监督微调（SFT）及强化学习（RL），重点在于强化学习的算法优化与数据精炼。
推理模式：提供两种模式——ReAct 模式（评估基础能力）与 IterResearch “Heavy” 模式（面向复杂推理与规划）。

DeerFlow

系统架构：构建于 LangGraph 之上的模块化多代理系统，采用状态驱动的工作流设计。
代理角色：包括协调者（流程管理）、规划者（任务拆解）、研究员（信息收集）、编码员（代码执行）、报告员（成果生成）。
设计思路：突出模块化与灵活性，通过代理协作实现复杂任务的高效分工。

2.2 工具集成与功能

Tongyi DeepResearch

集成工具：
- Serper.dev：网页与学术搜索
- Jina.ai：网页读取
- OpenAI 兼容 API：内容摘要
- Dashscope：文件解析
- SandboxFusion：Python 沙箱环境
功能定位：工具用于提升 LLM 的检索与处理能力，核心仍以模型为主。

DeerFlow

集成工具（支持灵活拓展）：
- 搜索：Tavily、Brave Search、DuckDuckGo、Arxiv
- 爬虫：Jina
- 代码执行：Python REPL
- 语音合成：Volcengine TTS
- 演示生成：Marp-cli
功能定位：工具是系统不可或缺的一部分，确保从数据收集到成果生成的全链条支持。

2.3 用户交互与成果输出

Tongyi DeepResearch

交互方式：以脚本配置与 API 调用为主，面向开发者与研究人员。
输出成果：主要为研究问答与文本信息综合，以标准数据集的真值答案作为性能评估。

DeerFlow

交互方式：支持“人类在环”机制，用户可用自然语言干预和调整研究计划，交互体验更友好。
输出成果：可生成多样化的研究成果，包括：
- 类 Notion 风格的研究报告
- 播客脚本
- PowerPoint 演示文稿

三、关键差异对比表

特性	Tongyi DeepResearch（阿里巴巴）	DeerFlow（字节跳动）
核心理念	模型驱动的代理式 LLM 框架，专注深度信息检索	社区驱动的多代理框架，面向端到端自动化
架构特点	单体式 LLM + 稀疏激活机制	基于 LangGraph 的模块化多代理系统
训练重点	合成数据生成（AgentFounder）与强化学习优化	依托预训练模型，突出工具编排与代理协作
交互模式	开发者导向：脚本配置与 API 调用	用户友好：自然语言反馈与干预
输出类型	文本化信息综合与问答	多模态成果（报告、播客、演示文稿）
可扩展性	通过 API 扩展数据输入与处理	插拔式工具与自定义代理，灵活拓展能力强

四、结论

Tongyi DeepResearch 与 DeerFlow 分别代表了两条不同的发展路径：

Tongyi DeepResearch：以大模型为核心，追求推理与信息综合的极限性能。适合对复杂问题解决和知识整合要求极高的科研与开发场景。
DeerFlow：以框架为核心，强调端到端自动化与多模态成果产出。其优势在于工具编排与可扩展性，更适合需要高效生成完整研究成果的实际应用。

选择建议：

若目标是探索代理式 LLM 的前沿能力，追求顶尖的信息检索与推理性能，应选择 Tongyi DeepResearch。
若需求是提升研究流程自动化程度，并快速产出多样化、可直接使用的成果，则 DeerFlow 更为适合。

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

CodeBuddy Code CLI代码宇宙：一句话完成视频切割工具开发

2048 AI社区

聚焦 AI 应用基础设施，云栖大会 Serverless AI 全回顾

2025 年 9 月 26 日，为期三天的云栖大会在杭州云栖小镇圆满闭幕。随着大模型技术的飞速发展，我们正从云原生时代迈向一个全新的 AI 原生应用时代。为了解决企业在 AI 应用落地中面临的高成本、高复杂度和高风险等核心挑战，阿里云基于函数计算 FC 发布一系列重磅服务。

2048 AI社区

LongCat-Flash-Thinking 正式发布，更强、更专业，保持极速！

今天，美团 LongCat 团队正式发布全新高效推理模型 LongCat-Flash-Thinking。在保持了 LongCat-Flash-Chat 极致速度的同时，全新发布的 LongCat-Flash-Thinking 更强大、更专业。综合评估显示，LongCat-Flash-Thinking 在逻辑、数学、代码、智能体等多个领域的推理任务中，达到了全球开源模型的最先进水平（SOTA）。