基于Dify+Ollama+Xinference构建企业私有化RAG与Agent大模型应用实操（下）

基于 Dify 实现 RAG、Agent “大模型应用落地”是目前企业落地 AI 场景最简单也是必须的路径，我分两篇文章，从“原理->Dify 部署->模型私有化部署->Agent 搭建案例” 完整演示一下实操过程，本文为第二篇。

AI-智能

184人浏览 · 2025-12-09 10:35:43

AI-智能 · 2025-12-09 10:35:43 发布

⚠️警告：本文 3200 字，收藏慢看

第 3 章 Dify构建企业级RAG与Agent应用

3.1 应用(App)：对话工作流机器人

这里会通过Dify构建一个简单的对话工作流机器人

选择对话工作流

编写提示词：这里设计一个有特色的，便于显著看出实现效果。

你是一个小猫机器人助手，你会解答用户的问题，然后在每一句话结束的时候喵喵叫一下

点击预览，开始测试

测试成功后发布更新

3.2 智能体(Agent)：北京旅行助手

🎯****概述

智能助手（Agent Assistant），利用大语言模型的推理能力，能够自主对复杂的人类任务进行目标规划、任务拆解、工具调用、过程迭代，并在没有人类干预的情况下完成任务。

准备工作

本例中 Dify 将会调用外部 duckduckgo API，需确保 dify 所在服务器可以⽆障碍访问国际互联网

应用搭建

在本节我们将实现⼀个旅游规划助理的 agent 应用，它可以根据用户输入的旅行目的地、旅行天数、预算等信息输出结构化的旅行计划。

3.2.1 创建一个空白的Agent应用

3.2.2 添加提示词

提示词太长，方便看我截图了，需要完整文本提示词的，可以“本公众号对话框加回复消息“旅行顾问提示词”免费领取”

这里的提示词

3.2.3 在功能中添加对话开场白和内容审查等功能

{{name}}先生、女士,我是您的个性化旅行助理,你是否已经准备好开始一段充满冒险和放松的旅程了?让我们一起打造您难忘的旅行体验吧!请告诉我您的旅行目的、预算和行程天数,比如:您能帮我计划一次家庭旅行吗?我们计划去北京10天,预算一万人民币您能帮我计划一次情侣蜜月旅行吗?我们计划去北京5天,预算七千人民币

内容审查设置

提问被拦截演示

3.2.4 完整测试

3.3 知识库(RAG)

3.3.1 源数据格式

通过使用Dify，可以方便快捷地构建私有知识库。可以将知识库放在工作流中，协同多种工具一起使用。而且Dify提供的知识库功能有着简洁的可视化界面，可以很方便地进行管理，适用于个人和团队。

目前Dify支持多种源数据格式，包括：

长文本内容：TXT、Markdown、DOCX、HTML、JSON、 PDF
结构化数据：CSV、Excel

注：私有知识库要达到良好的效果，必须与embedding模型和reranker模型相结合，请在xinterface中启用相关模型并引入Dify。

3.3.2 构建私有知识库

步骤1：首先创建一个新的知识库

步骤2：上传知识库文件

这里准备的是一部刑法的txt格式文本，用自然段的形式划分了每一条法则

步骤3：分段设置

大语言模型存在有限的上下文窗口，通常需要将整段文本进行分段处理后，将与用户问题关联度最高的几个段落召回，即分段 top-K 召回模式。此外，在用户问题与文本分段进行语义匹配时，合适的分段大小将有助于匹配关联性最高的文本内容，减少信息噪音。

分段标识符：

如果是\n则是以换行为一个分段；如果是\n\n则是以一个段落为一个分段。点击预览块查看目前块划分的情况。
分段重叠长度：

一般是分段最大长度的10%-20%。
知识库文档里如果有url、邮箱，还可以把这些过滤掉。

步骤4：选择索引方式

这里自动选择高质量。高质量的准确性更高，但是token消耗也会增加。我们这里使用的是部署到本地的模型，所以没有影响。

还有Q&A方式。如果文档是问答方式，那选择这种方式是最契合的。

步骤5：检索设置

在这里可以选择Embedding模型和Rerank模型，也可以设置Top K，也就是选出最相似的前n条。选择Score阈值，即筛选文本的相似度阈值。

🎯****拓展

关于**全文检索、向量检索HNSW、混合检索** 可以看我另一篇文章：🌈 实体对齐-全文检索-HNSW

**混合检索：**既包括向量检索（涉及rerank检索的大模型），也包含全文检索。

设置完成后，保存并处理即可。

📎刑法.txt

3.3.3 测试

接下来我们进行测试使用。在工作室中创建一个聊天助手

将提示词写为:

你是一个法律小助手，请只根据知识库中的信息，简要回答用户提问的案件触犯了哪些法律

知识库选择刚才添加的刑法.txt，然后可以开始提问。

可以观察到，聊天助手会自动引用知识库中的内容进行回答。

3.4 工作流(Workflow)：钉钉智能助手

我们可以通过Dify的工作流结合多种工具与节点。它们会进行协作进而实现工作流的功能。

我们这里构建一个使用了钉钉群机器人的消息反馈工作流。将用户的文字问题进行分类和拆解分析后通过钉钉群机器人发送到群中。【企业微信 webhook 同理】

如下是其工作流的配置。

3.4.1 开始

工作流从此处开始。我们在输入字段中添加自己指定的输入内容

3.4.2 问题分类器

这里调用了两级问题分类器。问题分类器会调用LLM，从问题列表中选择最与用户的提问符合的一条，然后进入该条

3.4.3 总结助手

是问题分类器的下游，在系统提示词中传递进两级分类的名称，以及初始问题，要求进行总结（需要输入变量的时候只需要输入一个 / 即可开始联想寻找）

3.4.4 钉钉群消息工具

首先在Dify的工具中添加这个钉钉群机器人工具

我们要使用PC端的钉钉进行群机器人的创建。首先你需要在一个你是管理员的组织内创建一个群，然后才能在这个群里创建机器人

保存这个加签秘钥，之后会用到

保存下来这个Webhook，后面也会用到

完成了创建。

之后在钉钉机器人工具中的ACCESS TOKEN中填入刚才复制的Webhook中的access_token的值，在加签秘钥中填入刚才保存的加签秘钥。

注意：ACCES TOKEN 一定要填写Webhook中的access_token的值

https 😕/oapi.dingtalk.com/robot/send?access_token={你的 token}

3.4.5 测试

点击运行，输入初始反馈信息，开始运行

运行成功

好记性不如烂笔头，快快动手做一下去吧～

想入门 AI 大模型却找不到清晰方向？备考大厂 AI 岗还在四处搜集零散资料？别再浪费时间啦！2025 年 AI 大模型全套学习资料已整理完毕，从学习路线到面试真题，从工具教程到行业报告，一站式覆盖你的所有需求，现在全部免费分享！

👇👇扫码免费领取全部内容👇👇

一、学习必备：100+本大模型电子书+26 份行业报告 + 600+ 套技术PPT，帮你看透 AI 趋势

想了解大模型的行业动态、商业落地案例？大模型电子书？这份资料帮你站在 “行业高度” 学 AI：

1. 100+本大模型方向电子书

在这里插入图片描述

2. 26 份行业研究报告：覆盖多领域实践与趋势

报告包含阿里、DeepSeek 等权威机构发布的核心内容，涵盖：

职业趋势：《AI + 职业趋势报告》《中国 AI 人才粮仓模型解析》；
商业落地：《生成式 AI 商业落地白皮书》《AI Agent 应用落地技术白皮书》；
领域细分：《AGI 在金融领域的应用报告》《AI GC 实践案例集》；
行业监测：《2024 年中国大模型季度监测报告》《2025 年中国技术市场发展趋势》。

3. 600+套技术大会 PPT：听行业大咖讲实战

PPT 整理自 2024-2025 年热门技术大会，包含百度、腾讯、字节等企业的一线实践：

在这里插入图片描述

安全方向：《端侧大模型的安全建设》《大模型驱动安全升级（腾讯代码安全实践）》；
产品与创新：《大模型产品如何创新与创收》《AI 时代的新范式：构建 AI 产品》；
多模态与 Agent：《Step-Video 开源模型（视频生成进展）》《Agentic RAG 的现在与未来》；
工程落地：《从原型到生产：AgentOps 加速字节 AI 应用落地》《智能代码助手 CodeFuse 的架构设计》。

二、求职必看：大厂 AI 岗面试 “弹药库”，300 + 真题 + 107 道面经直接抱走

想冲字节、腾讯、阿里、蔚来等大厂 AI 岗？这份面试资料帮你提前 “押题”，拒绝临场慌！

1. 107 道大厂面经：覆盖 Prompt、RAG、大模型应用工程师等热门岗位

面经整理自 2021-2025 年真实面试场景，包含 TPlink、字节、腾讯、蔚来、虾皮、中兴、科大讯飞、京东等企业的高频考题，每道题都附带思路解析：

2. 102 道 AI 大模型真题：直击大模型核心考点

针对大模型专属考题，从概念到实践全面覆盖，帮你理清底层逻辑：

3. 97 道 LLMs 真题：聚焦大型语言模型高频问题

专门拆解 LLMs 的核心痛点与解决方案，比如让很多人头疼的 “复读机问题”：

三、路线必明： AI 大模型学习路线图，1 张图理清核心内容

刚接触 AI 大模型，不知道该从哪学起？这份「AI大模型学习路线图」直接帮你划重点，不用再盲目摸索！

在这里插入图片描述

路线图涵盖 5 大核心板块，从基础到进阶层层递进：一步步带你从入门到进阶，从理论到实战。

L1阶段:启航篇丨极速破界AI新时代

L1阶段：了解大模型的基础知识，以及大模型在各个行业的应用和分析，学习理解大模型的核心原理、关键技术以及大模型应用场景。

L2阶段：攻坚篇丨RAG开发实战工坊

L2阶段：AI大模型RAG应用开发工程，主要学习RAG检索增强生成：包括Naive RAG、Advanced-RAG以及RAG性能评估，还有GraphRAG在内的多个RAG热门项目的分析。

L3阶段：跃迁篇丨Agent智能体架构设计

L3阶段：大模型Agent应用架构进阶实现，主要学习LangChain、 LIamaIndex框架，也会学习到AutoGPT、 MetaGPT等多Agent系统，打造Agent智能体。

L4阶段：精进篇丨模型微调与私有化部署

L4阶段：大模型的微调和私有化部署，更加深入的探讨Transformer架构，学习大模型的微调技术，利用DeepSpeed、Lamam Factory等工具快速进行模型微调，并通过Ollama、vLLM等推理部署框架，实现模型的快速部署。

L5阶段：专题集丨特训篇【录播课】

四、资料领取：全套内容免费抱走，学 AI 不用再找第二份

不管你是 0 基础想入门 AI 大模型，还是有基础想冲刺大厂、了解行业趋势，这份资料都能满足你！
现在只需按照提示操作，就能免费领取：

👇👇扫码免费领取全部内容👇👇

2025 年想抓住 AI 大模型的风口？别犹豫，这份免费资料就是你的 “起跑线”！

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

2026届必备的六大AI写作工具解析与推荐

2048 AI社区

提示工程架构师必学的4个AI协同技巧，让提示更有吸引力

它不仅能提升AI模型（如GPT系列、Claude或Gemini）的输出质量，还能通过高效的提示设计，降低团队协作成本、加速开发流程。试想：一个精心设计的提示就像建筑师精准的蓝图，能引导AI生成符合预期的代码、文档或解决方案，避免模糊指令导致的错误迭代。常用框架包括CAPS（Context, Action, Purpose, Scope）和FAST（Focus, Action, Scenario,

2048 AI社区

Java基础总结（从0到1，学Java这一篇就够了）

L4阶段：大模型的微调和私有化部署，我们会更加深入的探讨Transformer架构，学习大模型的微调技术，利用DeepSpeed、Lamam Factory等工具快速进行模型微调；而L3 L4更多的是通过项目实战来掌握大模型的应用开发，针对以上大模型的学习路线我们也整理了对应的学习视频教程，和配套的学习资料。在你已经掌握了大模型技术之后，就需要开始准备面试，我们将提供精心整理的大模型面试题库，涵盖