【从零开始基于YOLO V8 实现目标检测任务】#6 模型训练后界面的参数详解
模型训练结束后,在终端会显示一些总结的参数信息,现对这些信息详细说明。
模型训练结束后,在终端会显示一些总结的参数信息,现对这些信息详细说明。
模型结构相关参数
-
layers :表示模型的层数。例如 “168 layers” 指该 YOLOv8 模型共有 168 层,这体现了模型的深度和复杂程度,一般来说,层数越多,模型能够学习到的特征可能越丰富,但也会增加计算量和训练时间。
-
parameters :即模型的参数数量,“3,006,428 parameters” 意味着模型中有 3,006,428 个可训练参数。参数数量越多,模型的表达能力和拟合能力可能越强,但同时也更容易出现过拟合现象,且训练和推理时对计算资源和内存的需求也会更大。
-
gradients :梯度数量,如 “0 gradients” 表示在训练结束后,模型参数的梯度为 0。这可能是因为训练达到了收敛状态,参数已经基本稳定,不再有明显的更新方向,或者是某些参数在训练过程中由于特定原因没有被更新导致的。
-
GFLOPs :即每秒十亿次浮点运算,“8.1 GFLOPs” 代表模型在一次前向传播过程中大约需要进行 8.1 亿次浮点运算。它是衡量模型计算复杂度的一个指标,GFLOPs 值越高,模型的计算量就越大,在训练和推理时对硬件的计算能力要求也越高。
数据集相关参数
-
class :指数据集中目标物体的类别数,比如如果数据集是一个有 80 个类别的目标检测数据集,那么这里的 “class” 就是 80。模型需要根据类别数来确定输出层的结构和相应的预测逻辑。
-
images :表示训练过程中所使用的图像数量,如 “images 1000” 表示训练数据集包含 1000 张图像,这反映了模型训练的数据规模,更多的图像数据通常有助于模型更好地学习特征和泛化到新的场景。
-
instances :数据集中目标物体的实例数,例如 “instances 2000” 表明在训练数据中一共有 2000 个目标物体实例。它可以帮助了解数据集的丰富程度和模型需要处理的目标数量,对于评估模型的检测能力和效果有一定参考意义。
模型性能指标参数
-
box(P(precision) :精确率,是指在模型预测出的所有目标物体中,实际为真正例的比例。例如,如果模型预测了 100 个目标物体,其中有 80 个是真正的目标物体,那么精确率就是 80/100=0.8,精确率越高,说明模型预测的准确性越好,误报的情况越少。
-
r(recall) :召回率,是指在所有实际存在的目标物体中,模型正确预测出的比例。比如,数据集中有 100 个实际的目标物体,模型正确预测出了 90 个,那么召回率就是 90/100=0.9,召回率越高,表示模型对目标物体的检测越全面,漏报的情况越少。
-
map50 :平均精度均值(mean Average Precision),在 IOU 阈值为 0.5 的情况下计算得出。它综合考虑了模型在不同类别上的精确率和召回率表现,是对模型目标检测性能的一个较为全面的评价指标,map50 值越高,说明模型的整体检测性能越好。
-
map50-95 :是在 IOU 阈值从 0.5 到 0.95 的范围内计算的平均精度均值,相比 map50 更能全面地衡量模型在不同检测难度下的性能,是对模型鲁棒性和准确性的更高要求,其数值越大,表明模型在各种情况下的检测效果越稳定和优秀。
Speed(速度)
-
1.8ms preprocess(预处理时间)
-
这是模型对输入图像进行预处理所花费的时间。预处理通常包括图像的缩放、归一化等操作,目的是将原始图像转换为模型能够接受的格式。例如,将不同尺寸的图像调整到统一的大小,对像素值进行归一化处理以适应模型的输入要求等。在这个例子中,每张图像的预处理时间是 1.8 毫秒。
-
-
123.0ms inference(推理时间)
-
推理时间是指模型对预处理后的图像进行实际的目标检测计算所花费的时间。它是模型的核心计算阶段,涉及到卷积神经网络的前向传播过程,通过网络的各个层来提取特征并进行预测。对于目标检测任务来说,这一步会输出图像中可能存在的目标物体的位置(以边界框的形式)和类别概率。在这个例子中,推理时间是 123.0 毫秒,这可能意味着模型的复杂度较高或者硬件计算能力有限,因为推理时间相对较长。
-
-
0.0ms loss(损失计算时间)
-
损失计算时间是在训练阶段,计算模型预测结果与真实标签之间的差异所花费的时间。损失函数用于衡量模型的预测性能,通过比较预测的目标边界框和类别与实际的真值来计算损失值。这个时间在这个例子中是 0.0 毫秒,可能是由于在打印该信息时,损失计算这个阶段的时间被忽略不计或者四舍五入后显示为 0,也有可能是因为在特定的代码实现或者计算方式下,损失计算的时间被合并到其他阶段的时间统计中。
-
-
0.8ms postprocess(后处理时间)per image(每张图像)
-
后处理时间是指对模型的输出结果进行进一步处理所花费的时间。对于目标检测任务,后处理可能包括非极大值抑制(NMS)等操作。非极大值抑制用于去除冗余的边界框,保留最有可能包含目标物体的边界框。在这个例子中,每张图像的后处理时间是 0.8 毫秒。
-
更多推荐
所有评论(0)