从 0 到 1:用 ModelEngine 编排「多源数据周报智能体」——可视化工作流 + 自动知识库 + MCP 服务接入

项目 数值
阅读时长 12 min
核心代码 65 行
运行成本 0 元(社区赠送 10 万 Token)
浏览器即可开发

目录

  1. 背景:为什么又要“多源”又要“自动”
  2. 整体架构:一张图看懂智能体链路
  3. 准备工作:3 分钟注册 + 模板导入
  4. Step1 知识库自动生成:URL 一键爬取 → 向量拆分 → 秒级完成
  5. Step2 提示词自动生成:LLM 自举,让模型自己写 System Prompt
  6. Step3 可视化编排:拖拉 6 个节点,完成“数据获取→总结→通知”闭环
    6.1 节点清单与参数截图
    6.2 关键分支条件写法(大于/小于/包含)
  7. Step4 多智能体协作:
    7.1 数据清洗 Agent(Python 脚本节点)
    7.2 总结 Agent(大模型节点)
    7.3 通知 Agent(Webhook 节点)
  8. Step5 MCP 服务接入:把公司内网 MySQL 注册成“工具”,天然安全
  9. 调试技巧:日志追踪 + 断点回放
  10. 效果评估
  11. 与 Dify/Coze 对比:ModelEngine 的 3 个差异化优势
  12. 踩坑与解决方案(Token 超限、节点循环、并发锁)
  13. 后续规划:Plugin 市场 + 定时触发 + 多租户
  14. 结论 & 一键复用链接

1. 背景:为什么又要“多源”又要“自动”

  • 数据源多:MySQL、飞书表格、CSV 邮件附件、REST API
  • 格式乱:日期字段有 6 种写法,列名随时变
  • 需求急:老板每周一 9:30 要“可视化周报”,且需要“同比/环比”

传统做法:Python 脚本 + Airflow + 人工 copy 图表,改一次需求就要上线一次。
目标:让业务同学也能 30 分钟改模板,零发版。

2. 整体架构:一张图看懂智能体链路

定时触发器
每周一 8:00
数据获取节点
MySQL+REST+飞书
数据清洗 Agent
Python 脚本节点
知识库检索
Top5 相似段落
总结 Agent
LLM 节点
通知 Agent
Webhook 飞书群

3. 准备工作:3 分钟注册 + 模板导入

  1. 打开 ModelEngine → 微信扫码 → 新建“应用编排”
  2. 点击右上角「导入模板」→ 输入 weekly_report_demo → 一键克隆
  3. 免费领取 10 万 Token(新人弹窗)→ 完成

4. Step1 知识库自动生成:URL 一键爬取 → 向量拆分 → 秒级完成

目的:让 LLM 知道“什么是好的周报”

配置项
入口地址 https://github.com/microsoft/vscode-wiki/wiki/Weekly-Status
递归深度 2
切片长度 512 token
向量模型 text-embedding-ada-002(平台内置)

操作路径:
知识库 Tab → 新建 → 自动抓取 → 粘贴 URL → 开始生成
结果:2 min 完成 63 段文本,平均得分 0.83(平台自动给出)

5. Step2 提示词自动生成:LLM 自举,让模型自己写 System Prompt

Prompt 模板(已内置):

你是一名资深数据分析师,请根据以下材料,为“数据周报智能体”撰写一段 System Prompt,要求:
1. 强调对比思维(环比/同比)
2. 输出结构化 Markdown
3. 字数 150~200

LLM 输出(节选):

你是一名 BI 专家,专注用数据讲故事。用户会提供上周与本周的指标,你需要:①计算环比;②若环比>5% 用🚀,<-5% 用⚠️;③输出三级 Markdown 标题;④禁止编造数据。

直接把这段内容填到「大模型节点-System Prompt」输入框即可,无需人工润色。

6. Step3 可视化编排:拖拉 6 个节点,完成闭环

6.1 节点清单与参数截图(文字描述)

序号 节点类型 名称 关键参数
1 定时触发 WeeklyTimer Cron: 0 8 * * 1
2 MySQL 查询 QueryOrder SQL: SELECT DATE(dt), sum(amount) FROM order WHERE dt>=CURDATE()-INTERVAL 14 DAY
3 Python 脚本 CleanData 见下方代码
4 知识库检索 SearchKB TopK=5, Score>0.75
5 大模型 SummaryLLM Model=gpt-3.5-turbo, Temp=0.3
6 Webhook FeishuBot URL = {{YOUR_WEBHOOK_URL}}, Method = POST

6.2 关键分支条件写法

在「CleanData」节点后添加条件分支:

if payload['环比'] > 0.05:
    走高分支 → 添加🚀
else:
    走低分支 → 添加⚠️

平台支持直接写 Python 表达式,无需 YAML。

7. Step4 多智能体协作

7.1 数据清洗 Agent(Python 脚本节点)

def handle(payload):
    import pandas as pd
    df = pd.DataFrame(payload['order'])
    df['dt'] = pd.to_datetime(df['dt'])
    last_week = df[df['dt']>=pd.Timestamp.today()-pd.Timedelta(days=7)]['amount'].sum()
    prev_week = df[df['dt']<pd.Timestamp.today()-pd.Timedelta(days=7)]['amount'].sum()
    ratio = (last_week - prev_week) / prev_week
    return {'上周': round(prev_week, 2),
            '本周': round(last_week, 2),
            '环比': round(ratio, 4)}

平台已内置 pandas,无需 requirements.txt

7.2 总结 Agent(大模型节点)

  • System Prompt:Step2 自动生成
  • User Prompt:
上周={上周},本周={本周},环比={环比}  
请用 Markdown 三级标题,输出 80 字总结。

7.3 通知 Agent(Webhook 节点)

Body 模板:

{
  "msg_type": "post",
  "content": {
    "post": {
      "zh_cn": {
        "title": "🤖 本周数据快报",
        "content": [[{"tag": "text", "text": "{{summary}}"}]]
      }
    }
  }
}

平台支持 {{变量}} 自动替换,无需手写 JSON 转义

8. Step5 MCP 服务接入:把公司内网 MySQL 注册成“工具”

痛点:数据库在内网,公网 IP 不可访问
方案:MCP(ModelEngine Connector Proxy)1 分钟穿透

# 一键脚本(Linux & Windows)
curl -sSL https://modelengine.cn/mcp.sh | bash -s -- --token YOUR_TOKEN

脚本自动完成:

  1. 生成 RSA 密钥对
  2. 与平台保持长连接(wss)
  3. 本地 3306 端口映射到「平台-数据源地址」

效果:在编排界面直接填写 127.0.0.1:3306,平台却走加密隧道,公网 0 暴露,安全合规

9. 调试技巧:日志追踪 + 断点回放

  • 每节点右侧「运行日志」可展开 Input/Output/Error 三栏
  • 点击「回放」可重新执行该节点,无需重跑完整流程
  • 若 Token 超限,日志会给出 “本次消耗 12 347 tokens” 精确数字,方便预算

10. 效果评估

指标 手工脚本 ModelEngine 智能体 降幅
开发人日 3 天 2 小时 ↓ 92 %
生成耗时 40 min 90 s ↓ 96 %
人工校验点 15 处 3 处 ↓ 80 %
发版次数 1 次/周 0 ↓ 100 %

11. 与 Dify/Coze 对比:ModelEngine 的 3 个差异化优势

维度 Dify Coze ModelEngine
可视化编排深度 单层流程图 单层流程图 子流程+嵌套分支
内网数据源 需自建反向代理 不支持 一键 MCP 穿透
Token 明细账单 仅总量 节点级 精确到 prompt 字符

12. 踩坑与解决方案

现象 根因 解决
Token 超限 节点报 429 知识库 TopK=20 降到 5,score>0.75
节点循环 日志无限重复 条件写错「>=」 改「>」并加 break 标记
并发锁 MySQL 死锁 两条流同时跑 MCP 加 &readOnly=true

13. 后续规划

  1. 插件市场:把清洗脚本封装成「订单环比」插件,开源上架
  2. 定时触发:支持 Cron 表达式秒级(已内测)
  3. 多租户:部门 A/B 共享模板,数据权限隔离到行级

14. 结论 & 一键复用链接

  • 0 代码拖拉即可上线可维护、可观测、安全合规的多源数据智能体
  • 开发周期从「天」降到「小时」,业务同学也能改模板
  • 复用链接:在 ModelEngine 模板市场搜索 weekly_report_demo → 一键导入 → 改数据库连接即可

如果你也做了有趣智能体,欢迎留言交换模板,一起把 AI 真正落到生产环境!

活动声明

本文原创公开首发于 CSDN,参加「ModelEngine·创作计划征文活动」。
如需转载,请在文首注明出处与作者:@yu779

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐