阿里基座模型构建智能体之意图分类套件
本文探讨了意图分类在危废管理等复杂业务场景中的应用价值。通过预先将用户意图划分为整体数据查询、分类排名查询、明细下钻查询、重点问题分析等五类,并借助Qwen2-72B大模型进行自动识别,实现了查询请求的智能路由处理。文章详细介绍了分类模型配置、意图描述定义、示例补充等关键环节,展示了如何通过意图分类套件构建具备业务理解能力的智能问答系统,显著提升处理效率和准确性。
为什么需要意图分类?
在危废管理这类复杂业务场景中,用户提出的问题形式多样,但背后往往隐含着几类典型的数据需求模式。若不加区分地用同一套逻辑处理所有问题,不仅效率低下,还容易答非所问。
因此,我们预先将用户意图划分为五类,并通过大模型进行自动识别,再路由到对应的处理模块——这正是意图分类的价值所在。
一、分类模型配置
首先,在百炼平台中选择一个性能强劲且适合中文理解的基座模型。本次我采用了 Qwen 2.5-72 B,其在长文本理解与指令遵循方面表现稳定,特别适合处理业务语义相对密集的查询语句。
二、定义核心意图类别
意图分类的准确性高度依赖于意图描述的质量。描述需要足够清晰、具体,让模型能理解“什么问题属于这一类”。以下是我在危废业务中提炼出的五类核心意图:
| 意图名称 | 意图描述 |
|---|---|
| 整体数据查询 | 用户希望获取宏观统计数据,如问题总数、处置量、处置率等。常见关键词:“数量”“统计”“汇总”“总体情况”。 |
| 分类排名查询 | 用户希望按区县、问题类别等维度分组排序,查看排名前 N(如前五)的重点情况。关键词如:“分类”“排名”“前五”“哪些区县最多”。 |
| 明细下钻查询 | 用户从宏观数据向下钻取,查看具体清单。通常包含明确筛选条件,如“渝中区所有‘贮存设施’类问题列表”。 |
| 重点问题分析 | 识别异常或高风险问题,如“长期未办结”“超期 30 天”“重复出现”“处置是否规范”“是否有附件”等。 |
| 其他查询 | 意图不明确或无法归类的兜底类别,确保系统鲁棒性。 |
💡 提示:意图描述不是简单罗列关键词,而是要定义判断边界。例如,“整体数据查询”强调“宏观”和“聚合”,而“明细下钻”则强调“具体条件”和“清单”。
三、补充分类示例(强烈推荐)
虽然大模型具备一定泛化能力,但在业务场景中加入少量高质量示例,能显著提升分类准确率。我为每类意图添加了 1–2 个典型样本:
-
整体数据查询
-
输入:“查询一下当前危废问题的总体处置情况。”
-
预期输出:
整体数据查询
-
-
分类排名查询
-
输入:“按区县统计一下,问题数量排名前五的是哪些?”
-
预期输出:
分类排名查询
-
-
明细下钻查询
-
输入:“给我列出渝中区所有‘贮存设施’类问题的详细清单。”
-
预期输出:
明细下钻查询
-
-
重点问题分析
-
输入:“找出超期超过 30 天还未办结的问题。”
-
预期输出:
重点问题分析
-
这些示例在百炼平台的“分类示例”字段中配置后,模型对边缘案例的判断明显更准确。
四、工作流集成:从理解到执行
完成意图分类配置后,整个智能体的工作流就清晰了:
用户输入问题
↓
[意图分类套件调用 Qwen2.5-72B]
↓
根据分类结果路由至专用处理节点:
├── 整体数据查询 → 宏观统计查询(聚合SQL + 可视化)
├── 分类排名查询 → 分组排序查询(GROUP BY + ORDER LIMIT)
├── 明细下钻查询 → 明细数据查询(带条件筛选)
├── 重点问题分析 → 异常问题筛查(规则引擎 + 风险标签)
└── 其他查询 → 澄清引导或默认友好回复
通过这一机制,Agent 不再是“盲目回答”的工具,而是具备了初步语义理解能力的智能助手,能主动将用户引导至最合适的业务逻辑路径。

小结
在环保、政务、金融等垂直领域,用户的查询往往高度结构化,但表达方式却五花八门。借助阿里基座模型 + 意图分类套件,我们可以在不训练专用模型的前提下,快速搭建一个“懂业务”的问答系统。
意图分类只是第一步。真正的智能在于——理解之后,如何行动?, 后续将继续更新更多的 AI 智能体套件,欢迎持续关注哦~
🖐 如有帮助,请收藏、点赞、评论、转发一条龙~
微信公众号:环境猫 er
CSDN : 细节处有神明
个人博客:https://maoyu92.github.io/
更多推荐


所有评论(0)