Task4(MCP实战+语音文本转化)
注:本文相关笔记内容,主要基于课程资料整理而成。课程中关于 Dify 平台操作、大模型应用搭建流程、功能模块开发等核心知识点,为笔记创作提供了重要支撑。
注:本文相关笔记内容,主要基于 Datawhale 2025年 12 月组队学习 ——《基于 Dify 的大模型应用开发》 课程资料整理而成。课程中关于 Dify 平台操作、大模型应用搭建流程、功能模块开发等核心知识点,为笔记创作提供了重要支撑。
一、MCP实战
遇到的问题:
在MCP配置的时候报错

解决方法:
重新研究了教程中2.4 (MCP SSE / StreamableHTTP用法介绍)填写样例的代码组成,根据自己的配置,按照样例改写了这个代码块


运行效果:

收获:
第一次在Agent中使用工具,查阅资料了解到,在 Dify 的 Agent 中,“工具” 是 Agent 实现功能扩展的核心组件,作用是让 Agent 能调用外部服务 / 能力来完成特定任务(比如查询、数据获取等)。本小结中所配置的三个工具的具体作用如下:
1. mcp_sse 获取MCP工具列表
- 作用:让 Agent 先获取 12306-MCP 服务提供的所有可用工具(比如 “查询车次”“筛选车票” 等功能接口),明确自己能调用的具体能力范围。
- 对应场景:你提示词里要求 “调用 MCP 工具时先获取工具列表”,这个工具就是用来完成 “获取工具列表” 这一步的,是后续调用具体 MCP 功能的前置步骤。
2. mcp_sse 调用MCP工具
- 作用:是 Agent 实际执行 12306 相关服务的核心工具,能调用 12306-MCP 提供的接口(比如查询湖州到杭州的高铁车次、规划行程等),获取真实的铁路出行数据。
- 对应场景:用户询问 “明天湖州到杭州的高铁有哪些” 时,Agent 通过这个工具调用 12306-MCP 的查询接口,拿到车次、时间、站点等信息,再整理后回复用户。
3. time 获取当前时间
- 作用:让 Agent 能获取系统当前的日期 / 时间,解决 “时间相关的动态需求”。
- 对应场景:用户问 “明天的高铁”,Agent 需要先通过这个工具拿到 “当前日期”,再计算出 “明天” 的具体日期(比如当前是 2025-12-25,“明天” 就是 2025-12-26),然后带着这个日期去调用 MCP 工具查询对应车次。
简单来说,这 3 个工具是 Agent 完成 “铁路出行服务” 的核心支撑:先通过获取MCP工具列表明确能力,再用time拿到当前时间确定查询范围,最后用调用MCP工具获取实际的车次数据,从而完成用户的查询需求。
二、语音文本转化任务
遇到的问题:
在配置Minimax时遇到了问题,一开始总是报错,还以为是Group写错了

解决方案:
第一次使用MiniMax,需要在官网进行实名认证,会赠送15元的可用额度,认证好之后,回到Dify的模型供应商,继续配置,就能够成功了

运行效果:

收获:
一开始我在直接回答节点中没有插入变量聚合器的 output,发现输出的结果中没有文字,仅有音频文件,而插入后就会显示文字,于是进一步进行了探究,这也让我明确了变量聚合器的核心作用:它是工作流里的 “变量中转枢纽”,能收集、整合多个节点(比如我这里的LLM和LLM 2)的输出变量,把分散的文本内容统一成一个变量传递给后续节点。
而之前无文字输出的原因也很清晰了:直接回答需要同时接收文本内容和语音文件,文本内容正是来自变量聚合器整合后的output;如果不插入它,TEXT TO SPEECH没有可转换的文本源,直接回答也缺少文字输入,自然只会生成音频、没有文字 —— 变量聚合器其实是给后续的语音转换、最终回复提供了内容来源。
这算是个很实用的收获,也让我更理解了工作流里节点间的变量依赖关系。

更多推荐



所有评论(0)