通义DeepResearch开源:300亿参数只激活30亿,3分钟写完万字文献综述!
通义DeepResearch是一个开源的深度研究智能体,拥有300亿参数,每次激活30亿参数。它专为长周期、深度信息检索任务设计,支持ReAct模式和深度模式(Heavy Mode),后者通过迭代研究范式(IterResearch)提升复杂推理能力。该项目采用全流程合成数据方案,无需人工干预即可生成高质量数据集,突破智能体能力上限。训练流程涵盖智能体持续预训练(Agentic CPT)、监督微调(
通义DeepResearch作为一款开源的深度研究智能体,凭借其强大的功能和先进的技术,为复杂信息检索和多步推理任务提供了全新的解决方案。它不仅在学术研究、市场分析、法律研究和出行规划等场景中展现出巨大的应用价值,还通过开源的方式鼓励开发者参与共建,共同推动深度研究智能体的发展和创新。
在当今信息爆炸的时代,快速准确地获取和整合复杂信息成为了一项极具挑战性的任务。无论是学术研究、市场分析还是政策制定,都需要对海量数据进行深度挖掘和分析。阿里巴巴推出的通义DeepResearch项目,正是为了解决这一痛点,它作为一款开源的深度研究智能体,能够高效地完成长周期、多步骤的信息检索和推理任务。
一、项目概述
通义DeepResearch是一个开源的深度研究智能体,拥有300亿参数,每次激活30亿参数。它专为长周期、深度信息检索任务设计,支持ReAct模式和深度模式(Heavy Mode),后者通过迭代研究范式(IterResearch)提升复杂推理能力。该项目采用全流程合成数据方案,无需人工干预即可生成高质量数据集,突破智能体能力上限。训练流程涵盖智能体持续预训练(Agentic CPT)、监督微调(SFT)和强化学习(RL),形成完整的端到端训练链路。
图片
二、核心功能
(一)长周期深度信息检索
通义DeepResearch能够处理多步骤的推理和规划任务,适用于学术研究、市场分析、政策制定等复杂场景。它可以在长时间内持续搜索和整合信息,直到找到问题的答案。
(二)多模式推理支持
支持ReAct模式和深度模式。ReAct模式严格遵循“思考-行动-观察”循环,适合评估模型的核心能力;深度模式通过迭代研究范式(IterResearch)提升复杂推理能力。
(三)全流程合成数据生成
采用自研的全流程合成数据方案,无需人工干预即可生成高质量数据集,支持从预训练到微调再到强化学习的完整训练链路,突破智能体能力上限。
(四)业务应用赋能
目前已成功应用于阿里巴巴内部多个场景,如与高德地图合作推出的AI原生出行Agent,可以结合实时数据为用户提供精准的出行建议和规划;在法律领域,“通义法睿”能够自动检索法条、类案和裁判文书,为法律从业者提供强大的生产力工具,提高法律研究和案件处理的效率。
(五)项目开源共建
项目完全开源,提供完整的代码、模型和数据;大家可以根据自己的需求对通义DeepResearch进行定制和优化,开发出更多具有创新性的应用。推动深度研究智能体的发展和创新。
三、技术揭秘
(一)全流程合成数据方案
无需人工干预,自动生成高质量数据集,支持从预训练到微调再到强化学习的完整训练链路,突破智能体能力上限。
(二)迭代研究范式(IterResearch)
将复杂任务分解为多个研究回合,每个回合动态重构精简工作区,通过“思考-综合-行动”流程,提升复杂推理能力和决策质量。
(三)端到端强化学习
采用定制化的强化学习算法,如Group Relative Policy Optimization (GRPO),确保学习信号与模型当前能力精准匹配,提升模型在动态环境中的适应性和稳定性。
(四)大规模持续预训练
利用持续更新的知识文档、爬虫数据、知识图谱等构建开放世界知识记忆,生成多风格的(问题,答案)对,持续扩展模型能力。
(五)自动化数据管理
在训练动态的指导下实时优化数据,通过全自动数据合成和数据漏斗动态调整训练集,确保训练的稳定性和性能提升。
(六)稳定高效的工具沙盒
开发统一的沙盒环境,处理并发和故障,确保工具调用的稳定性和可靠性,为智能体提供快速且鲁棒的交互环境。
四、应用场景
(一)学术研究
学术研究中,学者筛选整理海量文献耗时艰巨。通义DeepResearch信息检索整合能力强,能快速在学术数据库等找相关文献,筛选分类、提取关键信息,快速整理文献综述。助学者高效完成研究,节省时间精力,投入创新研究,提升效率。
(二)市场分析
竞争激烈的商业环境下,企业需把握市场动态、了解对手及行业趋势以制定精准策略。通义DeepResearch可深入分析市场数据,整合行业报告、调研数据、企业财报等,提供全面的竞争对手分析,对比企业与对手在产品、份额、营销等方面优劣,结合行业趋势助企业预测市场走向。基于分析结果,企业能制定更具针对性和前瞻性的策略,提升竞争力,实现可持续发展。
(三)法律研究
法律研究与实践需深入分析大量法条、类案和裁判文书。通义DeepResearch在法律研究表现出色,如“通义法睿”可自动检索法律数据库,快速定位相关资料,还能深度归纳分析、提取关键信息、建立知识体系,为法律从业者提供高效工具,提升办案时获取依据、推理论证的效率与质量。
(四)出行规划
出行规划需考虑交通、天气、个人偏好等多因素,要实时处理大量数据。通义DeepResearch与高德地图合作推出AI原生出行Agent,结合交通、地图、天气等数据,依用户出发地、目的地和时间,综合考量交通方式优劣,推荐最优出行方案,保障用户最短时间到达,还提供实时路况与预警,让出行更便捷高效。
(五)复杂信息检索
当今信息时代,跨领域研究、政策制定等领域的研究与决策需复杂信息检索整合,任务涉及多领域知识,需多步骤推理规划。通义DeepResearch适用于此类任务,能依用户需求制定检索策略,经多轮检索推理缩小范围,快速获取整合信息,有机结合不同领域、来源信息,为用户提供全面准确信息支持,助其明智决策。
五、快速使用
(一)环境搭建
1. 安装依赖
确保已安装Python 3.10.0版本,使用`conda`或`virtualenv`创建独立环境。
conda create -n react_infer_env pythnotallow=3.10.0
conda activate react_infer_env
2. 安装必需的依赖
pip install -r requirements.txt
(二)配置环境
1. 复制环境文件
将`.env.example`复制为`.env`,并根据实际情况填写API密钥和配置。
cp .env.example .env
2. 准备评估数据:支持JSON和JSONL两种格式的输入文件。
- JSONL格式(推荐):
```
{"question": "What is the capital of France?", "answer": "Paris"}
{"question": "Explain quantum computing", "answer": ""}
```
- JSON格式:
```
[
{"question": "What is the capital of France?", "answer": "Paris"},
{"question": "Explain quantum computing", "answer": ""}
]
```
(三)运行推理脚本
1. 配置推理脚本
打开`run_react_infer.sh`,根据注释修改`MODEL_PATH`、`DATASET`和`OUTPUT_PATH`等变量。
2. 运行推理脚本
执行以下命令运行推理脚本:
bash run_react_infer.sh
3. 使用OpenRouter API调用模型
如果需要通过OpenRouter API调用模型,需在`inference/react_agent.py`中设置API密钥和URL,并将模型名称更改为`alibaba/tongyi-deepresearch-30b-a3b`。
六、结语
通义DeepResearch作为一款开源的深度研究智能体,凭借其强大的功能和先进的技术,为复杂信息检索和多步推理任务提供了全新的解决方案。它不仅在学术研究、市场分析、法律研究和出行规划等场景中展现出巨大的应用价值,还通过开源的方式鼓励开发者参与共建,共同推动深度研究智能体的发展和创新。
项目地址
项目官网:https://tongyi-agent.github.io/blog/introducing-tongyi-deep-research/
Github仓库:https://github.com/Alibaba-NLP/DeepResearch
HuggingFace模型库:https://huggingface.co/Alibaba-NLP/Tongyi-DeepResearch-30B-A3B
AI大模型学习福利
作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
一、全套AGI大模型学习路线
AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!
因篇幅有限,仅展示部分资料,需要点击文章最下方名片即可前往获取
二、640套AI大模型报告合集
这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。
因篇幅有限,仅展示部分资料,需要点击文章最下方名片即可前往获
三、AI大模型经典PDF籍
随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。
因篇幅有限,仅展示部分资料,需要点击文章最下方名片即可前往获
四、AI大模型商业化落地方案
因篇幅有限,仅展示部分资料,需要点击文章最下方名片即可前往获
作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量
更多推荐
所有评论(0)