在机器学习中,“多分类”和“多标签”是两种不同的任务类型,主要区别在于每个样本的标签数量和种类。

1.多分类(Multi-Class Classification)

定义:每个样本只能属于一个类别,从多个类别中选择一个类别进行分类。

标签数:每个样本只有一个标签,且标签来自有限的类别集合。

任务特点:多分类问题通常用于场景中需要从多个互斥类别中选择一个类别的情况。例如:垃圾邮件分类(正常邮件或垃圾邮件)、手写数字识别(0到9的数字)。

例子(手写数字识别):为了预测一个图像属于哪一个数字类别,输入图像,输出是数字类别(0,1,2...9)。

2.多标签(Multi-Label Classification)

定义:每个样本可以同时属于多个类别,任务是为每个样本分配多个标签(标签之间不互斥)

标签数:每个样本可以有多个标签,每个标签是一个二元问题(属于或不属于某个标签)。这是针对每个标签独立进行预测的。

任务特点:多标签问题适用于一个样本可能涉及多个类别的情况。例如:文本分类中,一篇为张可能同时属于体育和政治类别,或者图像中的一个物体同时属于猫和狗类别。

例子:为了预测一张图像是否包含多个物体,输入图像(可能包含猫、狗、鸟等),输出的标签是[猫,狗],即同时属于猫和狗类别。

3.核心区别:

标签互斥性:多分类任务重的标签是互斥的,即每个样本只能属于一个类别。多标签任务中的标签是不互斥的,即每个样本可以同时属于多个类别。

输出形式:多分类输出一个类别标签。多标签输出多个标签,通常是一个二元的标记向量。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐