西瓜书填坑【一】假设空间与版本空间

在西瓜问题中，如何根据训练集求所对应的版本空间？①写出假设空间：先列出所有可能的样本点（即特征向量）（即每个属性都取到所有的属性值）②对应着给出的已知数据集，将与正样本不一致的、与负样本一致的假设删除。即可得出与训练集一致的假设集合，也就是版本空间了。假设空间是在已知属性和属性可能取值的情况下，对所有可能满足目标（好瓜）的情况的一种毫无遗漏的假设集合。例子：假设一...

晚安丶

7058人浏览 · 2019-02-13 16:39:54

晚安丶 · 2019-02-13 16:39:54 发布

在西瓜问题中，如何根据训练集求所对应的版本空间？

①写出假设空间：先列出所有可能的样本点（即特征向量）（即每个属性都取到所有的属性值）

②对应着给出的已知数据集，将与正样本不一致的、与负样本一致的假设删除。

即可得出与训练集一致的假设集合，也就是版本空间了。

假设空间是在已知属性和属性可能取值的情况下，对所有可能满足目标（好瓜）的情况的一种毫无遗漏的假设集合。

例子：

假设一个瓜的好或不好，由三个属性确定。分别是色泽、根蒂、敲声。

其中，色泽有青绿、乌黑、浅白3种取值，根蒂有蜷缩、稍蜷、硬挺3种取值，敲声有浊响、清脆、沉闷3种取值。

那么假设空间由形如 “(色泽=？) ∧ (根蒂=？) ∧ (敲声=？)” 的所有假设组成。

除了考虑属性色泽、根蒂、敲声分别有3 、3、3种可能取值，还要考虑到一种属性可能无论取什么值都合适（用通配符*表示），另外有一种情况就是好瓜这个概念根本不成立（用∅表示），则假设空间大小为（3 + 1）×（3 + 1）×（3 + 1）+ 1 = 65 。

表1
编号	色泽	根蒂	敲声
1	*	*	*
2	青绿	*	*
3	乌黑	*	*
4	浅白	*	*
5	*	蜷缩	*
6	*	硬挺	*
7	*	稍蜷	*
8	*	*	浊响
9	*	*	清脆
10	*	*	沉闷
11	青绿	蜷缩	*
12	青绿	硬挺	*
13	青绿	稍蜷	*
14	乌黑	蜷缩	*
15	乌黑	硬挺	*
16	乌黑	稍蜷	*
17	浅白	蜷缩	*
18	浅白	硬挺	*
19	浅白	稍蜷	*
20	青绿	*	浊响
21	青绿	*	清脆
22	青绿	*	沉闷
23	乌黑	*	浊响
24	乌黑	*	清脆
25	乌黑	*	沉闷
26	浅白	*	浊响
27	浅白	*	清脆
28	浅白	*	沉闷
29	*	蜷缩	浊响
30	*	蜷缩	清脆
31	*	蜷缩	沉闷
32	*	硬挺	浊响
33	*	硬挺	清脆
34	*	硬挺	沉闷
35	*	稍蜷	浊响
36	*	稍蜷	清脆
37	*	稍蜷	沉闷
38	青绿	蜷缩	浊响
39	青绿	蜷缩	清脆
40	青绿	蜷缩	沉闷
41	青绿	硬挺	浊响
42	青绿	硬挺	清脆
43	青绿	硬挺	沉闷
44	青绿	稍蜷	浊响
45	青绿	稍蜷	清脆
46	青绿	稍蜷	沉闷
47	乌黑	蜷缩	浊响
48	乌黑	蜷缩	清脆
49	乌黑	蜷缩	沉闷
50	乌黑	硬挺	浊响
51	乌黑	硬挺	清脆
52	乌黑	硬挺	沉闷
53	乌黑	稍蜷	浊响
54	乌黑	稍蜷	清脆
55	乌黑	稍蜷	沉闷
56	浅白	蜷缩	浊响
57	浅白	蜷缩	清脆
58	浅白	蜷缩	沉闷
59	浅白	硬挺	浊响
60	浅白	硬挺	清脆
61	浅白	硬挺	沉闷
62	浅白	稍蜷	浊响
63	浅白	稍蜷	清脆
64	浅白	稍蜷	沉闷
65	Ø