第一章:绪论
机器学习(Machine Learning)本质上是一种从数据中自动学习经验的技术。一句话总结:给机器一堆“例子”(数据),让它自己发现规律,并用于预测新情况。生活中大量应用机器学习:手机的人脸识别抖音推荐ChatGPT(大模型)自动驾驶医学影像诊断很多人会把机器学习理解为“写规则给电脑”,但真实情况恰恰相反:📌不是程序员写规则,而是机器自己找规则。这也是机器学习的魅力所在。
🍉 机器学习入门(《西瓜书》第一章:绪论)——最通俗的一篇博客
本文基于《机器学习》(周志华·西瓜书)第一章内容,面向 0 基础读者,用最容易理解的方式带你打开机器学习的大门。
1.1 引言:什么是机器学习?
机器学习(Machine Learning)本质上是一种从数据中自动学习经验的技术。
一句话总结:
给机器一堆“例子”(数据),让它自己发现规律,并用于预测新情况。
生活中大量应用机器学习:
-
手机的人脸识别
-
抖音推荐
-
ChatGPT(大模型)
-
自动驾驶
-
医学影像诊断
很多人会把机器学习理解为“写规则给电脑”,但真实情况恰恰相反:
📌 不是程序员写规则,而是机器自己找规则。
这也是机器学习的魅力所在。
1.2 基本术语:机器学习的语言
本节介绍了一些最核心的术语。你只要搞懂这些,后面 80% 的内容都能理解。
1)样本(Instance)
数据中的一个“对象”。
例子:一个西瓜、一张图片、一个用户。
2)特征(Feature)
描述样本的属性。
例如西瓜的:
-
纹理
-
敲击声
-
大小
-
颜色
就像人的身高、体重、年龄。
3)特征空间(Feature Space)
所有特征组合成的“空间”。
如果有 3 个特征,就是一个三维空间。
特征越多,空间越高维。
4)标签(Label)
我们想预测的目标变量。
例:
-
“好瓜/坏瓜”(分类)
-
房价(回归)
5)训练集 / 测试集
-
训练集:给机器学习规律
-
测试集:检验机器是否真正“学会了”
过程类似学生做题:
-
练习册 = 训练集
-
考试题 = 测试集
1.3 假设空间(Hypothesis Space)
这是本章最核心的概念之一。
为了预测“好瓜坏瓜”,我们会选择一种“模型形式”,例如:
-
决策树
-
线性模型
-
神经网络
-
贝叶斯模型
⚠️ 你选的模型形式可以产生很多“可能的规律”,这些规律的集合,就是假设空间。
🔍 举例理解假设空间
如果你用线性模型 y = ax + b
那么所有不同 a、b 组合 → 构成一个假设空间。
如果你用决策树
所有可能的树结构 → 又是一个更大的假设空间。
📌 假设空间越大,越容易过拟合;越小,越容易欠拟合。
1.4 归纳偏好(Inductive Bias)
“为什么机器学习能从例子中得出结论?”
因为机器必须带着一些“偏好”才能学习,这种偏好叫:
👉 归纳偏好(Inductive Bias)
它决定了模型更倾向选择哪些规律。
🔍 类比理解
你有 A、B 两条可能的规律:
-
A:简单(比如线性)
-
B:复杂(像神经网络画的曲线)
如果你的模型偏向简单规律 → 偏好简单结构
如果模型偏向“能拟合所有点 → 偏好复杂模型”
机器学习不是从零开始猜测,而是:
在某些规律“更有可能”的前提下,从数据中挑出最匹配的那一个。
这是归纳偏好的意义。
1.5 机器学习的发展历程(简史、非常好懂版本)
机器学习几十年的发展大致可分为四个阶段:
1)符号主义(20 世纪 60-70s)
以逻辑推理、规则为主。
核心思想:
“用规则描述一切智能。”
代表方法:决策树、专家系统。
2)连接主义(80-90s)
受大脑神经结构启发 → 神经网络兴起。
但因算力有限,当时没发展起来。
3)统计学习(90s-2010)
机器学习进入“数学与统计为主导”的阶段。
代表方法:
-
SVM(支持向量机)
-
贝叶斯方法
-
随机森林
这是西瓜书最重视的时代。
4)深度学习(2012-现在)
算力爆发 + 大数据 → 神经网络复兴。
应用进入爆炸期:
-
自动驾驶
-
GPT、Transformer
-
语音识别
-
图像识别
📌 今天你看到的 AI 奇迹,大多来自深度学习。
1.6 机器学习的应用现状
机器学习已经渗透到几乎所有行业。
🔍 1)计算机视觉
-
人脸识别
-
医学影像(CT、MRI)
-
自动驾驶摄像头
🔍 2)NLP(自然语言处理)
-
翻译
-
文本分类
-
ChatGPT
🔍 3)推荐系统
-
抖音、微博、淘宝推送
-
B 站推荐视频
🔍 4)金融风控
-
信用评分
-
欺诈检测
🔍 5)医学诊断
-
预测疾病
-
图像识别癌症
🔍 6)工业制造
-
设备预测性维护
-
质量检测
一句话概括:
机器学习 = 可落地应用最多、商业价值最高的计算机技术之一。
1.7 阅读材料(推荐给初学者的材料)
西瓜书第一章列了一些参考资料。这里我给你一个更“初学者友好”的顺序。
入门级(必看)
-
《机器学习》—— 周志华(本书)
-
《统计学习方法》—— 李航(更数学但经典)
-
Andrew Ng 吴恩达课程(Coursera)
进阶(想深入可看)
-
Pattern Recognition and Machine Learning — Bishop
-
The Elements of Statistical Learning — ESL(非常经典)
工程实践
-
Python + sklearn
-
Pytorch
-
Kaggle 竞赛项目
🌟 第一章小结(超简版)
-
机器学习让电脑从“例子”中学习规律
-
核心概念:样本、特征、标签、训练集
-
假设空间 = 所有可能的模型规律
-
归纳偏好 = 模型偏向某类规律
-
机器学习发展经历了 4 次浪潮
-
应用无处不在:推荐、识别、金融、医疗
第一章主要是在让你建立整体认识,第二章才开始数学化、系统化。
习题(附解析)
我把第一章习题做了通俗解析,适合博客:
习题 1:什么是机器学习?举例说明。
机器学习通过数据学习规律。
如:用大量房价数据训练模型 → 预测未来房价。
习题 2:什么是特征与特征空间?举例说明。
-
特征:描述对象的属性(如西瓜纹理)
-
特征空间:所有特征构成的空间(如三维空间)
习题 3:归纳偏好是什么?为什么需要?
模型必须带着“偏好”才能从有限数据中学习。
否则无法判断哪条规律更加合理。
习题 4:举一个机器学习应用实例。
如:淘宝推荐商品 → 输入你的行为 → 输出推荐结果。
参考文献(博客可附加)
-
周志华,《机器学习》
-
Bishop, Pattern Recognition and Machine Learning
-
Hastie, Tibshirani, Friedman, The Elements of Statistical Learning
-
吴恩达,《机器学习课程》
更多推荐



所有评论(0)