为什么需要意图分类?

在危废管理这类复杂业务场景中,用户提出的问题形式多样,但背后往往隐含着几类典型的数据需求模式。若不加区分地用同一套逻辑处理所有问题,不仅效率低下,还容易答非所问。

因此,我们预先将用户意图划分为五类,并通过大模型进行自动识别,再路由到对应的处理模块——这正是意图分类的价值所在。

一、分类模型配置

首先,在百炼平台中选择一个性能强劲且适合中文理解的基座模型。本次我采用了 Qwen 2.5-72 B,其在长文本理解与指令遵循方面表现稳定,特别适合处理业务语义相对密集的查询语句。

二、定义核心意图类别

意图分类的准确性高度依赖于意图描述的质量。描述需要足够清晰、具体,让模型能理解“什么问题属于这一类”。以下是我在危废业务中提炼出的五类核心意图:

意图名称 意图描述
整体数据查询 用户希望获取宏观统计数据,如问题总数、处置量、处置率等。常见关键词:“数量”“统计”“汇总”“总体情况”。
分类排名查询 用户希望按区县、问题类别等维度分组排序,查看排名前 N(如前五)的重点情况。关键词如:“分类”“排名”“前五”“哪些区县最多”。
明细下钻查询 用户从宏观数据向下钻取,查看具体清单。通常包含明确筛选条件,如“渝中区所有‘贮存设施’类问题列表”。
重点问题分析 识别异常或高风险问题,如“长期未办结”“超期 30 天”“重复出现”“处置是否规范”“是否有附件”等。
其他查询 意图不明确或无法归类的兜底类别,确保系统鲁棒性。

💡 提示:意图描述不是简单罗列关键词,而是要定义判断边界。例如,“整体数据查询”强调“宏观”和“聚合”,而“明细下钻”则强调“具体条件”和“清单”。

三、补充分类示例(强烈推荐)

虽然大模型具备一定泛化能力,但在业务场景中加入少量高质量示例,能显著提升分类准确率。我为每类意图添加了 1–2 个典型样本:

  • 整体数据查询

    • 输入:“查询一下当前危废问题的总体处置情况。”

    • 预期输出:整体数据查询

  • 分类排名查询

    • 输入:“按区县统计一下,问题数量排名前五的是哪些?”

    • 预期输出:分类排名查询

  • 明细下钻查询

    • 输入:“给我列出渝中区所有‘贮存设施’类问题的详细清单。”

    • 预期输出:明细下钻查询

  • 重点问题分析

    • 输入:“找出超期超过 30 天还未办结的问题。”

    • 预期输出:重点问题分析

这些示例在百炼平台的“分类示例”字段中配置后,模型对边缘案例的判断明显更准确。

四、工作流集成:从理解到执行

完成意图分类配置后,整个智能体的工作流就清晰了:

用户输入问题
        ↓
[意图分类套件调用 Qwen2.5-72B]
        ↓
根据分类结果路由至专用处理节点:
    ├── 整体数据查询  → 宏观统计查询(聚合SQL + 可视化)
    ├── 分类排名查询  → 分组排序查询(GROUP BY + ORDER LIMIT)
    ├── 明细下钻查询  → 明细数据查询(带条件筛选)
    ├── 重点问题分析  → 异常问题筛查(规则引擎 + 风险标签)
    └── 其他查询      → 澄清引导或默认友好回复

通过这一机制,Agent 不再是“盲目回答”的工具,而是具备了初步语义理解能力的智能助手,能主动将用户引导至最合适的业务逻辑路径。

小结

在环保、政务、金融等垂直领域,用户的查询往往高度结构化,但表达方式却五花八门。借助阿里基座模型 + 意图分类套件,我们可以在不训练专用模型的前提下,快速搭建一个“懂业务”的问答系统。

意图分类只是第一步。真正的智能在于——理解之后,如何行动?, 后续将继续更新更多的 AI 智能体套件,欢迎持续关注哦~

🖐 如有帮助,请收藏、点赞、评论、转发一条龙~
微信公众号:环境猫 er
CSDN : 细节处有神明
个人博客:https://maoyu92.github.io/

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐