DataWorks Agent 正式发布!对话即开发,AI Agent 重新定义数据生产力
阿里云 DataWorks Agent 正式发布,推出面向数据开发治理的全新智能范式——用自然语言对话驱动全链路数据开发,让“你说,我做”成为现实。
近日,阿里云 DataWorks Agent 正式发布,推出面向数据开发治理的全新智能范式——用自然语言对话驱动全链路数据开发,让“你说,我做”成为现实。
现在,只需输入一句描述,DataWorks Agent 就能自动完成从需求理解、任务构建、代码生成到调度发布的全流程操作,真正实现“对话即开发”。

核心功能发布:两大场景,全面提效
场景一:数据开发 Agent —— 一句话生成可上线 ETL 任务
还在手动建表、写SQL、配调度?现在,你只需要说:
“请按照需求文档中的内容,构建“直播间商品成交数据”的ads层。
要求:
1.需遵从数仓建设规范,同步建设dwd、dws层的表及代码,并使用工作流来承载所有开发任务
2.ADS层的表使用 StarRocks 和 Hologres 实现,其余的表使用 Serverless Spark和 MaxCompute 实现”
DataWorks Agent 会自动:
-
需求理解与语义解析,识别关键词,判断任务类型和目标用途;
-
工作流创建,设置合理的上下游依赖
-
自动代码生成,应用最佳实践,支持生成SQL/Python多语言代码;
-
智能调度配置,设置每日定时调度,对应凌晨1点执行,同时配置失败策略;
-
自动生成任务描述,发起最终发布。
特别适用于:
数据量大、ETL任务频繁、团队协作复杂的企业,有效解决开发效率瓶颈、新人上手慢、业务需求响应延迟等问题,或正在推进数据平台智能化升级的企业。
场景二:数据治理 Agent —— 自动化智能数据质量治理
手动一条一条写数据质量规则太麻烦了,现在,你只需要说:
“帮我针对dim_user_info这张核心用户维表,自动生成质量规则。”
DataWorks Agent 会自动:
-
解析表结构并识别字段类型、业务含义及关键字段(如主键、手机号、性别等);
-
基于字段特性与业务重要性,智能推荐主键唯一性校验、非空约束、性别字段枚举值校验等规则;
-
一键完成规则配置并绑定监控策略。
通过自然语言指令即可完成以往需人工探查、分析、配置的复杂流程,显著降低数据治理门槛;规则推荐基于专家级治理经验,确保治理策略的准确性与有效性。
“找出热门访问表未配置质量规则的表,推荐并配置质量规则。”
DataWorks Agent 会自动:
-
通过数据资产治理健康,自动识别高频访问的热门表,且无质量规则配置保障的表;
-
结合表字段语义、产出任务信息、血缘信息及与历史配置,智能生成定制化规则组合(如金额字段范围校验、时间字段格式校验),批量生成质量监控及规则的配置建议;
-
用户确认后,自动针对多张表进行质量监控及规则的设置;数据质量模块将按照配置,运行质量监控。
无需人工筛选目标表或手动设计规则,系统主动识别质量治理问题,并提供可行的解决方案,大幅提升数据质量覆盖率与治理效率。

特别适用于:
快速配置核心表质量规则,统一治理多源数据资产,自动化监控高频质量问题,在大规模场景下补齐规则、保障新表合规,并支持审计前集中治理。
技术背后:不只是大模型,更是“有记忆、能决策”的 Agent
DataWorks Copilot 并非简单的 Prompt 工具,而是具备完整 Agent 能力的智能体系统:

|
能力 |
说明 |
|
深度理解与自主规划 |
基于上下文感知与多轮对话,准确识别复杂意图,自主将任务分解为可执行的多步骤计划 |
|
数据开发治理过程自动化 |
深度融合 DataWorks 核心产品能力与流程,全面打通上下文数据, 内置 DataWorks 工具集 |
用户实测反馈:效率飞跃,释放创造力
DataWorks Copilot 现已在阿里集团淘宝、天猫等内部团队深度使用,据用户实测反馈:
-
开发周期从“天级”缩短至“分钟级”
-
整体提效提升近10倍
-
80%以上的常规 ETL 任务可由 Agent 全自动完成
更重要的是,开发者终于可以从重复性劳动中解放出来,转向业务创新、业务价值挖掘,并探索AI与数据融合的新场景
正如用户所说:“我们不再只是‘搬砖’的工程师,而是真正的数据架构师。”
立即体验
📍 适用人群:数据工程师、ETL开发、BI分析师、数据产品经理
📍 适用场景:日常数据加工、报表开发、数据迁移、数仓建设、数据治理等
👉 体验入口:登录 DataWorks 控制台 → 点击 Copilot 图标 → 确认协议即可开启
提示:主账号、租户管理员或具备同等权限用户可一键开启公测,开启后该账号下所有成员均可使用。
更多推荐



所有评论(0)