1.3 J48决策树分类器的使用
导入glass.arff数据,选择“Classify”中的J48分类器。点击“start”,等一会儿将会出现运行结果表示有30个叶子节点,共有59个节点。Correctly Classified Instances14366.8224 %Incorrectly Classified Instances ...
导入glass.arff数据,选择“Classify”中的J48分类器。


点击“start”,等一会儿将会出现运行结果

表示有30个叶子节点,共有59个节点。
Correctly Classified Instances 143 66.8224 %
Incorrectly Classified Instances 71 33.1776 %
表示有66.8224%的样例被正确分类了。
=== Detailed Accuracy By Class ===
TP Rate FP Rate Precision Recall F-Measure MCC ROC Area PRC Area Class
0.714 0.174 0.667 0.714 0.690 0.532 0.806 0.667 build wind float
0.618 0.181 0.653 0.618 0.635 0.443 0.768 0.606 build wind non-float
0.353 0.046 0.400 0.353 0.375 0.325 0.766 0.251 vehic wind float
0.000 0.000 0.000 0.000 0.000 0.000 ? ? vehic wind non-float
0.769 0.010 0.833 0.769 0.800 0.788 0.872 0.575 containers
0.778 0.029 0.538 0.778 0.636 0.629 0.930 0.527 tableware
0.793 0.022 0.852 0.793 0.821 0.795 0.869 0.738 headlamps
Weighted Avg. 0.668 0.130 0.670 0.668 0.668 0.539 0.807 0.611
=== Confusion Matrix ===
a b c d e f g <-- classified as
50 15 3 0 0 1 1 | a = build wind float
16 47 6 0 2 3 2 | b = build wind non-float
5 5 6 0 0 1 0 | c = vehic wind float
0 0 0 0 0 0 0 | d = vehic wind non-float
0 2 0 0 10 0 1 | e = containers
1 1 0 0 0 7 0 | f = tableware
3 2 0 0 0 1 23 | g = headlamps
代表有7种类别的玻璃,对角线矩阵表示正确的分类。
更改配置信息:点击“J48-U-M 2”,将unpruned(未修剪)改成true

重新点击start,得到新的运行结果。(未修剪的决策树运行的结果)
Correctly Classified Instances 144 67.2897 %
Incorrectly Classified Instances 70 32.7103 %
此时得到正确的分类率为67.2897%>66.8%.
继续更改配置信息:minNumObj:每个叶节点所含实例的最少数量。
我们把它更改为大一点的数字15

改之前的数据:(6.0)表示叶节点所含实例的数量
(5.0/1.0)表示这个叶节点包含一个错误的分类实例和5个正确的分类实例。
Si <= 72.49
| | | | Ca <= 8.28: build wind non-float (6.0)
| | | | Ca > 8.28: vehic wind float (5.0/1.0)
更改最小实例为15个过后的结果。此时发现正确的分类率仅仅61.215%,错误的分类比较多,比如(15/6),表示这个叶节点有15个正确的分类,6个错误的分类。
J48 unpruned tree
------------------
Ba <= 0.27
| Mg <= 2.41
| | K <= 0.12: tableware (15.0/6.0)
| | K > 0.12: containers (20.0/8.0)
| Mg > 2.41
| | Al <= 1.41
| | | RI <= 1.51727: vehic wind float (16.0/9.0)
| | | RI > 1.51727
| | | | K <= 0.23: build wind float (27.0/8.0)
| | | | K > 0.23
| | | | | Mg <= 3.66: build wind float (41.0/5.0)
| | | | | Mg > 3.66: build wind non-float (16.0/3.0)
| | Al > 1.41: build wind non-float (50.0/10.0)
Ba > 0.27: headlamps (29.0/3.0)
Number of Leaves : 8
Size of the tree : 15
Correctly Classified Instances 131 61.215 %
图可视化:右击鼠标,选择“Visualize tree”

此时我们得到一个可视化的决策树。

如果Ba的含量高,则分类为headlamps。
如果Ba的含量低,我们继续看Mg的含量,如果Mg的含量低,我们继续看K的含量,如果K的含量低,则分类为tableware.
点击“more”,将会展示更多关于J48决策树分类器的信息。

J48分类器的信息

更多推荐



所有评论(0)