多标签和多分类有什么区别？

每个样本只能属于一个类别，从多个类别中选择一个类别进行分类。

司小逗

556人浏览 · 2025-04-04 15:53:56

司小逗 · 2025-04-04 15:53:56 发布

在机器学习中，“多分类”和“多标签”是两种不同的任务类型，主要区别在于每个样本的标签数量和种类。

1.多分类（Multi-Class Classification）

定义：每个样本只能属于一个类别，从多个类别中选择一个类别进行分类。

标签数：每个样本只有一个标签，且标签来自有限的类别集合。

任务特点：多分类问题通常用于场景中需要从多个互斥类别中选择一个类别的情况。例如：垃圾邮件分类（正常邮件或垃圾邮件）、手写数字识别（0到9的数字）。

例子（手写数字识别）：为了预测一个图像属于哪一个数字类别，输入图像，输出是数字类别（0,1,2...9）。

2.多标签（Multi-Label Classification）

定义：每个样本可以同时属于多个类别，任务是为每个样本分配多个标签（标签之间不互斥）

标签数：每个样本可以有多个标签，每个标签是一个二元问题（属于或不属于某个标签）。这是针对每个标签独立进行预测的。

任务特点：多标签问题适用于一个样本可能涉及多个类别的情况。例如：文本分类中，一篇为张可能同时属于体育和政治类别，或者图像中的一个物体同时属于猫和狗类别。

例子：为了预测一张图像是否包含多个物体，输入图像（可能包含猫、狗、鸟等），输出的标签是[猫，狗]，即同时属于猫和狗类别。

3.核心区别：

标签互斥性：多分类任务重的标签是互斥的，即每个样本只能属于一个类别。多标签任务中的标签是不互斥的，即每个样本可以同时属于多个类别。

输出形式：多分类输出一个类别标签。多标签输出多个标签，通常是一个二元的标记向量。

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

ops-transformer 是什么：五句话让一个完全不懂的人听明白

我有个朋友是做后端的老程序员，最近想转大模型训练方向，跟我说想了解一下昇腾 NPU 的算子生态。他对 PyTorch 熟悉，但没接触过 CANN，问了我一个问题：“ops-transformer 这个仓库到底解决了什么问题？我给他讲了大概二十分钟，最后他跟我说："你能不能用五句话概括？"我试了一下，发现做不到——因为这个仓库解决的不是一个问题，而是串联起了一整条链路上的多个问题。但我可以换一种方式