京东JoyAgent又又又开源了-对标阿里羚羊数据分析智能体

JoyAgent，Dataagent，数据分析，归因分析，羚羊

fkyyly

856人浏览 · 2025-09-20 11:32:07

fkyyly · 2025-09-20 11:32:07 发布

今年7月份京东开源了业界首个高完成度轻量化通用多智能体产品(JoyAgent-JDGenie)，得到了行业的广泛认可，当前已获7K star。今天京东又放大招了，在JoyAgent-JDGenie的基础上又开源了Dataagent能力，对标阿里的闭源的数据分析智能体产品羚羊。

https://github.com/jd-opensource/joyagent-jdgenie

简介

当前Data Agent相关竞品，有些不支持数据治理、有些不支持诊断分析、有些不开源。因此，我们从端到端开箱即用的角度，我们开源了JoyDataAgent其包含了数据治理DGP协议&工具、诊断分析和工作建议。特别对于诊断分析和工作建议，这类问题往往没有固定答案也无法通过例行报告自动呈现，正需要JoyDataAgent提供的“新角度”与aha moment来激发思考。对于JoyDataAgent是一个通用的智能问数的框架和产品，对于用户的场景，只需将表按照DGP协议进行治理后，即可直接进行问数和诊断分析。为了验证JoyDataAgent的通用性，在Birdsql公开榜单test集准确率75.35%排名第7（共84支提交队伍），目前得分领先于字节跳动DataAgent、IBM等竞争对手。

竞品功能分析

效果先进性：Birdsql榜单，Test 75.35%, Dev73.66%

系统架构

DGP协议

数据治理与挖掘（已完成）
- 表设计、字段设计、字段值设计5原则，提供相关的SDK以确保数据的准确、唯一、完整、一致、有效。
- 表设计原则：明细表和指标表不要混合、增量表和全量表不要混合。
- 字段设计原则：字段避免混淆、时点指标和时期指标语义要说明。
- 字段值设计原则：枚举值语义说明。
数据血缘治理（进行中）
- 采集数仓脚本进行SQLAST解析识别出字段、表、加工算子的血缘关系来构建图谱。
- 结合上语义上的补充构成丰富的知识图谱，以供RAG召回使用。
语义对齐和指标数据预编织（进行中）
- 语义上的归一对于数据质量很重要，语义构建需要分类，维度含义的统一，以及解决多处定义的冲突。
- 基于高质量语义与图谱知识的结合，从指标算子口径和语义口径上进行表要的模型预编织，用于在指标数据召回阶段精准约束SQL。

TableRAG和智能问数

TableRAG：两阶段动态选表选字段。
TableRAG：细粒度查询拆解，将复杂问题拆解为更小、更容易处理的语义单元，实现对表格行列值高效检索召回。
智能问数：自适应支持不同类型表的问数能力，明细表VS指标表，增量表VS全量表等。
智能问数：具备智能问数能力并结合图表的可视化展示。

诊断分析

多种归因分析工具：包括趋势、周期、异常、相关性、因果等归因方法。
SOPPlan：除了通用的诊断分析功能，此外还支持用户预定义分析流程。基于用户预定义分析流程，升级Plan&Solve模式为SOPPlan模式。
特别对于诊断分析和工作建议，这类问题往往没有固定答案也无法通过例行报告自动呈现，正需要JoyDataAgent提供的“新角度”与aha moment来激发思考。

文章来源

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

为什么更大的模型“学得更多“？——把“涌现“拆成容量、干扰与稀有任务记忆

2048 AI社区

CC-Switch不只是切换API：从GitHub更新日志看懂它的功能和底层原理

CC Switch：从配置切换器到AI编程统一管理平台摘要： CC Switch已从最初的Claude Code/Codex供应商切换工具，发展为功能全面的AI编程管理平台。它通过统一界面管理多个AI编程工具（Claude Code、Codex、Gemini CLI等）的配置，支持供应商切换、本地代理路由、跨工具能力同步等功能。核心演进包括：采用SSOT架构集中管理供应商数据、扩展支持6+工具、