引言

本文对两大深度研究代理框架进行了系统性比较:阿里巴巴 NLP 团队的 Tongyi DeepResearch 与字节跳动的 DeerFlow。二者均致力于利用大语言模型(LLMs)和多样化工具,实现研究过程的自动化与增强。虽然目标相似,但在体系架构、核心功能、训练方法及成果输出方面,两者展现出截然不同的思路与优势。


一、项目概览

1.1 Tongyi DeepResearch

  • 开发团队:阿里巴巴 NLP · 通义实验室
  • 核心定位:面向长周期、深层次信息检索任务的代理式大语言模型框架。其目标是通过先进的 LLM 能力与高效的数据合成技术,在代理式搜索基准中实现最前沿的表现。

1.2 DeerFlow

  • 开发团队:字节跳动
  • 核心定位:DeerFlow(Deep Exploration and Efficient Research Flow,深度探索与高效研究流程)是一个社区驱动的多代理研究框架。它融合语言模型与多种工具(网络搜索、爬虫、代码执行、语音合成等),旨在实现从信息收集到多模态成果生成的全流程自动化。

二、架构与技术差异

2.1 模型与核心技术

Tongyi DeepResearch

  • 规模与效率:拥有 305 亿参数,采用稀疏激活机制(每个 token 仅激活 33 亿参数),兼顾算力与性能。
  • 训练体系:通过自动化合成数据管道(AgentFounder),实施持续预训练(CPT)、监督微调(SFT)及强化学习(RL),重点在于强化学习的算法优化与数据精炼。
  • 推理模式:提供两种模式——ReAct 模式(评估基础能力)与 IterResearch “Heavy” 模式(面向复杂推理与规划)。

DeerFlow

  • 系统架构:构建于 LangGraph 之上的模块化多代理系统,采用状态驱动的工作流设计。
  • 代理角色:包括协调者(流程管理)、规划者(任务拆解)、研究员(信息收集)、编码员(代码执行)、报告员(成果生成)。
  • 设计思路:突出模块化与灵活性,通过代理协作实现复杂任务的高效分工。

2.2 工具集成与功能

Tongyi DeepResearch

  • 集成工具

    • Serper.dev:网页与学术搜索
    • Jina.ai:网页读取
    • OpenAI 兼容 API:内容摘要
    • Dashscope:文件解析
    • SandboxFusion:Python 沙箱环境
  • 功能定位:工具用于提升 LLM 的检索与处理能力,核心仍以模型为主。

DeerFlow

  • 集成工具(支持灵活拓展):

    • 搜索:Tavily、Brave Search、DuckDuckGo、Arxiv
    • 爬虫:Jina
    • 代码执行:Python REPL
    • 语音合成:Volcengine TTS
    • 演示生成:Marp-cli
  • 功能定位:工具是系统不可或缺的一部分,确保从数据收集到成果生成的全链条支持。


2.3 用户交互与成果输出

Tongyi DeepResearch

  • 交互方式:以脚本配置与 API 调用为主,面向开发者与研究人员。
  • 输出成果:主要为研究问答与文本信息综合,以标准数据集的真值答案作为性能评估。

DeerFlow

  • 交互方式:支持“人类在环”机制,用户可用自然语言干预和调整研究计划,交互体验更友好。

  • 输出成果:可生成多样化的研究成果,包括:

    • 类 Notion 风格的研究报告
    • 播客脚本
    • PowerPoint 演示文稿

三、关键差异对比表

特性 Tongyi DeepResearch(阿里巴巴) DeerFlow(字节跳动)
核心理念 模型驱动的代理式 LLM 框架,专注深度信息检索 社区驱动的多代理框架,面向端到端自动化
架构特点 单体式 LLM + 稀疏激活机制 基于 LangGraph 的模块化多代理系统
训练重点 合成数据生成(AgentFounder)与强化学习优化 依托预训练模型,突出工具编排与代理协作
交互模式 开发者导向:脚本配置与 API 调用 用户友好:自然语言反馈与干预
输出类型 文本化信息综合与问答 多模态成果(报告、播客、演示文稿)
可扩展性 通过 API 扩展数据输入与处理 插拔式工具与自定义代理,灵活拓展能力强

四、结论

Tongyi DeepResearchDeerFlow 分别代表了两条不同的发展路径:

  • Tongyi DeepResearch:以大模型为核心,追求推理与信息综合的极限性能。适合对复杂问题解决和知识整合要求极高的科研与开发场景。
  • DeerFlow:以框架为核心,强调端到端自动化与多模态成果产出。其优势在于工具编排与可扩展性,更适合需要高效生成完整研究成果的实际应用。

选择建议

  • 若目标是探索代理式 LLM 的前沿能力,追求顶尖的信息检索与推理性能,应选择 Tongyi DeepResearch
  • 若需求是提升研究流程自动化程度,并快速产出多样化、可直接使用的成果,则 DeerFlow 更为适合。
Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐