系列篇章💥

No. 文章
1 【GitHub开源AI精选】LLM 驱动的影视解说工具:Narrato AI 一站式高效创作实践
2 【GitHub开源AI精选】德国比勒费尔德大学TryOffDiff——高保真服装重建的虚拟试穿技术新突破
3 【GitHub开源AI精选】哈工大(深圳)& 清华力作 FilmAgent:剧本自动生成 + 镜头智能规划,开启 AI 电影制作新时代
4 【GitHub开源AI精选】Lumina - Image 2.0 文生图模型,以小参数量实现高分辨率多图生成新突破
5 【GitHub开源AI精选】探索 Mobile-Agent:X-PLUG 推出的创新型移动智能操作代理
6 【GitHub开源AI精选】吴恩达团队开源VisionAgent:用自然语言开启计算机视觉新时代
7 【GitHub开源AI精选】Oumi:一站式AI开发平台,涵盖训练、评估与部署全流程
8 【GitHub开源AI精选】深入剖析RealtimeSTT:开源实时语音转文本库的强大功能与应用
9 【GitHub开源AI精选】PodAgent:多智能体协作播客生成框架,自动化打造高质量播客,赋能内容创作与品牌传播
10 【GitHub开源AI精选】OpenManus开源AI工具:3小时复刻Manus,39.5k星
11 【GitHub开源AI精选】OpenGlass:大模型赋能的开源方案,25美元打造智能眼镜,支持语音控制+AR叠加
12 【GitHub开源AI精选】AppAgentX:西湖大学发布可自主进化的手机智能体,实现GUI操作的高效与智能
13 【GitHub开源AI精选】Agent-S架构揭秘:低代码+多模态融合的智能体新范式
14 【GitHub开源AI精选】Open-Interface:大模型驱动的计算机“自动驾驶”系统|自然语言操控的自动化工具
15 【GitHub开源AI精选】2025年AI工程师必备!AgentOps五大功能重构智能体开发流程
16 【GitHub开源AI精选】LangManus:社区驱动的多智能体AI自动化框架,开启复杂任务处理新纪元
17 【GitHub开源AI精选】autoMate:AI 驱动的本地自动化助手,用自然语言解锁高效办公,让电脑任务自己动起来
18 【GitHub开源AI精选】Sitcom-Crafter:北航联合港中文等高校打造的剧情驱动3D动作生成系统
19 【GitHub开源AI精选】Local Deep Researcher:本地化部署的AI研究助手,零门槛开启智能研究
20 【GitHub开源AI精选】Browser Use:开源AI自动化工具,让AI像人类一样操控网页
21 【GitHub开源AI精选】LLaVA-Med:微软打造的生物医学领域多模态AI助手,助力医疗智能化
22 【GitHub开源AI精选】RF-DETR:Roboflow 的实时目标检测模型『边缘设备鹰眼』,低至160FPS的工业级检测利器
23 【GitHub开源AI精选】MegaTTS 3:字节跳动开源语音利器,吊打VALL-E,自然度逼近真人录音
24 【GitHub开源AI精选】LocAgent:斯坦福联合耶鲁大学等机构推出的代码问题定位智能体
25 【GitHub开源AI精选】WhisperX:70倍实时语音转录!革命性词级时间戳与多说话人分离技术
26 【GitHub开源AI精选】Crawl4AI:LLM专属极速开源爬虫利器、1秒处理百万级数据
27 【GitHub开源AI精选】Oliva:开源语音RAG助手,一句话秒搜海量数据,多AI协作颠覆传统搜索
28 【GitHub开源AI精选】UFO²:微软开源的 Windows 桌面 Agent 操作系统,开启智能自动化新时代
29 【GitHub开源AI精选】ebook2audiobook:AI驱动的电子书转有声书利器,支持1107种语言+语音克隆
30 【GitHub开源AI精选】WebThinker:赋能大型推理模型的自主科研新范式
31 【GitHub开源AI精选】ZeroSearch:阿里巴巴开源的大模型搜索引擎框架,无需真实搜索引擎交互
32 【GitHub开源AI精选】Toolkami:极简AI Agent框架,七种工具实现高效轻量化开发
33 【GitHub开源AI精选】Docext:NanoNets 打造的文档提取利器,本地化、高效能、免费开源
34 【GitHub开源AI精选】SketchVideo:手残党福音!草图秒变大片,快手黑科技让创作效率飙升300%
35 【GitHub开源AI精选】NLWeb:微软开源的自然语言交互利器,让网站秒变智能AI应用
36 【GitHub开源AI精选】ScrapeGraphAI:基于LLM的智能爬虫,多页面爬取、语音生成,开启数据提取新纪元
37 【GitHub开源AI精选】FaceShot:同济大学联合上海 AI Lab 推出的无需训练肖像动画生成框架
38 【GitHub开源AI精选】Minion Agent:开源界的“全能王”,深度研究、自动规划全搞定
39 【GitHub开源AI精选】AgenticSeek:开源本地通用AI Agent,打造自主执行任务的智能助手
40 【GitHub开源AI精选】Morphik:开源多模态检索增强生成工具,助力AI应用开发
41 【GitHub开源AI精选】TEN VAD:高性能实时语音活动检测系统,助力AI对话系统高效交互
42 【GitHub开源AI精选】Google AI Edge Gallery:谷歌赋能的离线AI模型探索利器
43 【GitHub开源AI精选】PandasAI:一键开启数据对话时代,非技术用户也能轻松上手
44 【GitHub开源AI精选】ContentV:字节跳动开源的高效文生视频模型框架,助力AI视频生成技术突破
45 【GitHub开源AI精选】VRAG-RL:阿里通义推出的多模态RAG推理框架,助力视觉信息理解与生成
46 【GitHub开源AI精选】MultiTalk:中山大学与美团联合打造的音频驱动多人对话视频生成框架
47 【GitHub开源AI精选】Salesforce开源项目MAS-Zero:零监督下的多智能体系统设计框架
48 【GitHub开源AI精选】InftyThink:浙大联合北大打造的无限深度推理范式,突破大模型长推理瓶颈
49 【GitHub开源AI精选】RAG-Anything:港大开源利器、让AI真正理解复杂文档,PDF、表格、公式全能读
50 【GitHub开源AI精选】PreenCut深度解析:开源AI视频剪辑利器,用自然语言一句话精准定位片段
51 【GitHub开源AI精选】TradingAgents-CN:基于多智能体LLM的中文金融交易决策框架深度解析
52 【GitHub开源AI精选】KlicStudio:极简 AI 视频翻译配音工具,让跨平台内容本地化效率翻倍,GitHub狂揽7.9k星
53 【GitHub开源AI精选】JoyAgent-JDGenie:京东开源的通用多智能体系统,助力AI应用落地


前言

在人工智能领域,多智能体系统正逐渐成为推动技术发展的关键力量。京东开源的JoyAgent-JDGenie项目,以其强大的通用性和轻量化设计,为开发者提供了一个高效、便捷的多智能体解决方案。本文将深入探讨JoyAgent-JDGenie的技术原理、主要功能、应用场景以及性能表现,并通过实际部署案例展示其强大的功能。
在这里插入图片描述

一、项目概述

JoyAgent-JDGenie是京东开源的首个高完成度轻量化通用多智能体产品,作为完整的端到端智能体系统,无需二次开发即可直接使用,支持多种任务处理,如生成报告、分析数据等。该系统具备多智能体设计模式、跨任务记忆和工具进化机制等创新技术,能够在电商、办公、出行、教育和医疗等多个领域提供高效、便捷的智能化解决方案。在GAIA榜单上,JoyAgent-JDGenie的准确率高达75.15%,超越多个行业知名产品。

二、技术原理

(一)多智能体设计模式

JoyAgent-JDGenie采用了多种智能体设计模式,支持多层级的规划和思考(multi-level and multi-pattern thinking)。具体包括work level和task level,以及plan and executor模式和react模式。这种设计能够更好地应对复杂多变的任务场景,提升系统的灵活性和适应性。

(二)跨任务记忆

智能体能够记住之前处理过的相似任务的信息和经验,在处理新的相似任务时更加高效和准确。这一机制显著提高了系统的任务处理效率,减少了重复工作。

(三)工具进化机制

JoyAgent-JDGenie基于已有工具迭代生成新工具,自动拆解已有工具为原子工具,并结合大模型自动组合成新工具。这一机制减少了错误工具的生成,提高了开发效率。

(四)高并发DAG执行引擎

系统支持高并发的有向无环图(DAG)执行引擎,优化任务调度和资源分配,确保系统在高负载下仍能高效运行。

(五)多智能体上下文管理

JoyAgent-JDGenie能够管理多个智能体之间的上下文信息,确保智能体之间的协同工作流畅高效。

(六)全链路流式输出

系统支持全链路的流式输出,确保任务处理过程中的实时反馈和动态调整。

三、主要功能

(一)开箱即用的任务处理

JoyAgent-JDGenie能够直接处理用户输入的复杂任务,如生成报告、分析数据等,无需二次开发。用户只需输入任务描述,系统即可自动完成任务处理并输出结果。

(二)通用性强的框架设计

该系统支持用挂载子智能体或工具快速扩展功能,适应不同应用场景。开发者可以根据需求灵活添加或替换子智能体和工具,满足多样化的业务需求。

(三)多智能体协同工作

多个子智能体(如报告生成智能体、搜索智能体等)协同完成复杂任务,提升效率。例如,在生成报告任务中,搜索智能体负责收集数据,报告生成智能体负责整理和输出报告。

(四)多文件交付样式

JoyAgent-JDGenie支持网页版、PPT、Markdown等多种文件交付格式,满足不同用户的需求。用户可以根据自己的使用习惯选择合适的输出格式。

(五)工具进化机制

基于已有工具迭代生成新工具,自动拆解和重组原子工具,减少错误工具生成,提高开发效率。

(六)跨任务记忆

智能体能够记住相似任务信息,在处理新任务时更加高效准确。

四、应用场景

(一)电商领域

JoyAgent-JDGenie可以作为智能客服子智能体,快速处理用户咨询、订单查询和售后问题,提升客户服务效率和质量。例如,用户可以通过自然语言描述问题,系统自动识别并提供解决方案。

(二)办公场景

系统能够自动生成工作报告,收集、整理和分析数据,减轻员工工作负担,提高工作效率。例如,用户可以要求系统生成月度销售报告,系统自动从数据库中提取数据并生成报告。

(三)出行服务

挂载类似12306的工具后,用户可以查询火车票信息、规划出行路线,提供便捷的出行服务。例如,用户可以输入出发地、目的地和日期,系统自动查询车票信息并规划最佳路线。

(四)教育领域

JoyAgent-JDGenie可以作为智能辅导工具,为学生提供个性化的学习方案和辅导服务,帮助提高学习效果。例如,系统可以根据学生的学习进度和成绩,生成个性化的学习计划。

(五)医疗领域

系统能够协助医生进行病例分析、医学影像诊断等工作,为医疗服务提供辅助支持,提高医疗效率和质量。例如,系统可以分析医学影像数据,辅助医生进行诊断。

五、性能评估

在GAIA榜单上,JoyAgent-JDGenie的准确率高达75.15%,超越了OWL(CAMEL)、Smolagent(Huggingface)、LRC-Huawei(Huawei)、xManus(OpenManus)、AutoAgent(香港大学)等行业知名产品。这一表现证明了JoyAgent-JDGenie在多智能体系统领域的强大竞争力。其多智能体设计模式、跨任务记忆和工具进化机制等创新技术,为系统提供了高效的任务处理能力和强大的扩展性。
在这里插入图片描述

六、快速使用

(一)Docker一键启动服务(推荐)

1. 克隆项目代码:

git clone https://github.com/jd-opensource/joyagent-jdgenie.git

2. 进入项目目录,修改.env_template文件中的配置。
3. 构建Docker镜像:

docker build -t genie:latest .

4. 启动Docker容器:

docker run -d -p 3000:3000 -p 8080:8080 -p 1601:1601 -e OPENAI_BASE_URL="" -e OPENAI_API_KEY="" --name genie-app genie:latest

(二)手动初始化环境,启动服务

1. 环境准备
安装JDK 17和Python 3.11。
安装Python依赖:

pip install uv
cd genie-tool
uv sync
source .venv/bin/activate

2. 手动部署
检查依赖和端口占用情况:

sh check_dep_port.sh

启动所有服务:

sh Genie_start.sh

(三)二次开发

  1. 添加自定义工具:
 -`genie-backend/src/main/resources/application.yml`中添加MCP服务地址。
 - 实现`BaseTool`接口,声明工具的名称、描述、参数和调用方法。
 -`com.jd.genie.controller.GenieController#buildToolCollection`中添加自定义工具。
  1. 添加自定义子智能体:
 - 实现`BaseTool`接口,声明子智能体的名称、描述、参数和调用方法。
 -`com.jd.genie.controller.GenieController#buildToolCollection`中添加自定义子智能体。

七、结语

JoyAgent-JDGenie作为京东开源的通用多智能体系统,凭借其强大的技术原理、丰富的功能和广泛的应用场景,为AI大模型领域的发展提供了有力支持。无论是企业还是个人开发者,都可以通过JoyAgent-JDGenie快速构建高效、智能的应用系统。希望本文的介绍能够帮助读者更好地了解和使用JoyAgent-JDGenie,推动AI技术的进一步发展。

开源地址:https://github.com/jd-opensource/joyagent-jdgenie


在这里插入图片描述

🎯🔖更多专栏系列文章:AI大模型提示工程完全指南AI大模型探索之路(零基础入门)AI大模型预训练微调进阶AI大模型开源精选实践AI大模型RAG应用探索实践🔥🔥🔥 其他专栏可以查看博客主页📑

😎 作者介绍:资深程序老猿,从业10年+、互联网系统架构师,目前专注于AIGC的探索(CSDN博客之星|AIGC领域优质创作者)
📖专属社群:欢迎关注【小兵的AI视界】公众号或扫描下方👇二维码,回复‘入群’ 即刻上车,获取邀请链接。
💘领取三大专属福利:1️⃣免费赠送AI+编程📚500本,2️⃣AI技术教程副业资料1套,3️⃣DeepSeek资料教程1套🔥(限前500人)
如果文章内容对您有所触动,别忘了点赞、⭐关注,收藏!加入我们,一起携手同行AI的探索之旅,开启智能时代的大门!

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐