第一章：绪论

机器学习（Machine Learning）本质上是一种从数据中自动学习经验的技术。一句话总结：给机器一堆“例子”（数据），让它自己发现规律，并用于预测新情况。生活中大量应用机器学习：手机的人脸识别抖音推荐ChatGPT（大模型）自动驾驶医学影像诊断很多人会把机器学习理解为“写规则给电脑”，但真实情况恰恰相反：📌不是程序员写规则，而是机器自己找规则。这也是机器学习的魅力所在。

清空mega

710人浏览 · 2025-11-18 07:33:14

清空mega · 2025-11-18 07:33:14 发布

🍉 机器学习入门（《西瓜书》第一章：绪论）——最通俗的一篇博客

本文基于《机器学习》（周志华·西瓜书）第一章内容，面向 0 基础读者，用最容易理解的方式带你打开机器学习的大门。

1.1 引言：什么是机器学习？

机器学习（Machine Learning）本质上是一种从数据中自动学习经验的技术。

一句话总结：

给机器一堆“例子”（数据），让它自己发现规律，并用于预测新情况。

生活中大量应用机器学习：

手机的人脸识别
抖音推荐
ChatGPT（大模型）
自动驾驶
医学影像诊断

很多人会把机器学习理解为“写规则给电脑”，但真实情况恰恰相反：

📌 不是程序员写规则，而是机器自己找规则。

这也是机器学习的魅力所在。

1.2 基本术语：机器学习的语言

本节介绍了一些最核心的术语。你只要搞懂这些，后面 80% 的内容都能理解。

1）样本（Instance）

数据中的一个“对象”。

例子：一个西瓜、一张图片、一个用户。

2）特征（Feature）

描述样本的属性。
例如西瓜的：

纹理
敲击声
大小
颜色

就像人的身高、体重、年龄。

3）特征空间（Feature Space）

所有特征组合成的“空间”。

如果有 3 个特征，就是一个三维空间。
特征越多，空间越高维。

4）标签（Label）

我们想预测的目标变量。

例：

“好瓜/坏瓜”（分类）
房价（回归）

5）训练集 / 测试集

训练集：给机器学习规律
测试集：检验机器是否真正“学会了”

过程类似学生做题：

练习册 = 训练集
考试题 = 测试集

1.3 假设空间（Hypothesis Space）

这是本章最核心的概念之一。

为了预测“好瓜坏瓜”，我们会选择一种“模型形式”，例如：

决策树
线性模型
神经网络
贝叶斯模型

⚠️ 你选的模型形式可以产生很多“可能的规律”，这些规律的集合，就是假设空间。

🔍 举例理解假设空间

如果你用线性模型 y = ax + b
那么所有不同 a、b 组合 → 构成一个假设空间。

如果你用决策树
所有可能的树结构 → 又是一个更大的假设空间。

📌 假设空间越大，越容易过拟合；越小，越容易欠拟合。

1.4 归纳偏好（Inductive Bias）

“为什么机器学习能从例子中得出结论？”

因为机器必须带着一些“偏好”才能学习，这种偏好叫：

👉 归纳偏好（Inductive Bias）

它决定了模型更倾向选择哪些规律。

🔍 类比理解

你有 A、B 两条可能的规律：

A：简单（比如线性）
B：复杂（像神经网络画的曲线）

如果你的模型偏向简单规律 → 偏好简单结构
如果模型偏向“能拟合所有点 → 偏好复杂模型”

机器学习不是从零开始猜测，而是：

在某些规律“更有可能”的前提下，从数据中挑出最匹配的那一个。

这是归纳偏好的意义。

1.5 机器学习的发展历程（简史、非常好懂版本）

机器学习几十年的发展大致可分为四个阶段：

1）符号主义（20 世纪 60-70s）

以逻辑推理、规则为主。
核心思想：
“用规则描述一切智能。”

代表方法：决策树、专家系统。

2）连接主义（80-90s）

受大脑神经结构启发 → 神经网络兴起。

但因算力有限，当时没发展起来。

3）统计学习（90s-2010）

机器学习进入“数学与统计为主导”的阶段。

代表方法：

SVM（支持向量机）
贝叶斯方法
随机森林

这是西瓜书最重视的时代。

4）深度学习（2012-现在）

算力爆发 + 大数据 → 神经网络复兴。

应用进入爆炸期：

自动驾驶
GPT、Transformer
语音识别
图像识别

📌 今天你看到的 AI 奇迹，大多来自深度学习。

1.6 机器学习的应用现状

机器学习已经渗透到几乎所有行业。

🔍 1）计算机视觉

人脸识别
医学影像（CT、MRI）
自动驾驶摄像头

🔍 2）NLP（自然语言处理）

翻译
文本分类
ChatGPT

🔍 3）推荐系统

抖音、微博、淘宝推送
B 站推荐视频

🔍 4）金融风控

信用评分
欺诈检测

🔍 5）医学诊断

预测疾病
图像识别癌症

🔍 6）工业制造

设备预测性维护
质量检测

一句话概括：

机器学习 = 可落地应用最多、商业价值最高的计算机技术之一。

1.7 阅读材料（推荐给初学者的材料）

西瓜书第一章列了一些参考资料。这里我给你一个更“初学者友好”的顺序。

入门级（必看）

《机器学习》—— 周志华（本书）
《统计学习方法》—— 李航（更数学但经典）
Andrew Ng 吴恩达课程（Coursera）

进阶（想深入可看）

Pattern Recognition and Machine Learning — Bishop
The Elements of Statistical Learning — ESL（非常经典）

工程实践

Python + sklearn
Pytorch
Kaggle 竞赛项目

🌟 第一章小结（超简版）

机器学习让电脑从“例子”中学习规律
核心概念：样本、特征、标签、训练集
假设空间 = 所有可能的模型规律
归纳偏好 = 模型偏向某类规律
机器学习发展经历了 4 次浪潮
应用无处不在：推荐、识别、金融、医疗

第一章主要是在让你建立整体认识，第二章才开始数学化、系统化。

习题（附解析）

我把第一章习题做了通俗解析，适合博客：

习题 1：什么是机器学习？举例说明。

机器学习通过数据学习规律。
如：用大量房价数据训练模型 → 预测未来房价。

习题 2：什么是特征与特征空间？举例说明。

特征：描述对象的属性（如西瓜纹理）
特征空间：所有特征构成的空间（如三维空间）

习题 3：归纳偏好是什么？为什么需要？

模型必须带着“偏好”才能从有限数据中学习。
否则无法判断哪条规律更加合理。

习题 4：举一个机器学习应用实例。

如：淘宝推荐商品 → 输入你的行为 → 输出推荐结果。

参考文献（博客可附加）

周志华，《机器学习》
Bishop, Pattern Recognition and Machine Learning
Hastie, Tibshirani, Friedman, The Elements of Statistical Learning
吴恩达，《机器学习课程》

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

【算法随笔】P13983 数列分块入门 8

2048 AI社区

Claude Code 完整安装与使用攻略（Windows + Linux）

2048 AI社区

Spring AI 1.x 系列【7】提示词 API

2048 AI社区

所有评论(0)

查看更多评论

清空mega

@2301_78986604

已为社区贡献5条内容