基于深度学习的图像识别（cifar10数据集）

（2）在model对象中添加第一组“卷积层+池化层+Dropout层”，包括添加卷积层Conv2D（），输出通道数为32，卷积核大小为3×3，填充方式padding为’same’，使用ReLU函数作为激活函数，输入数据的形状为input_shape=x_train.shape[1:]；CIFAR-10作为计算机视觉领域的经典基准数据集，以其适中的规模、清晰的10个类别定义（涵盖飞机、汽车、鸟类等常

2301_77264990

968人浏览 · 2025-12-19 08:57:21

2301_77264990 · 2025-12-19 08:57:21 发布

✨ 项目背景 ✨

人工智能，特别是计算机视觉技术的迅猛发展，正深刻改变诸多领域，如自动驾驶、医疗影像和智能安防。在这一进程中，高质量图像数据集是算法训练与评估的核心基础。CIFAR-10作为计算机视觉领域的经典基准数据集，以其适中的规模、清晰的10个类别定义（涵盖飞机、汽车、鸟类等常见物体）和丰富的32x32像素彩色图像，成为研究者验证新算法性能、进行模型对比及学习图像识别技术的“试金石”。

然而，处理CIFAR-10这类小尺寸、低分辨率的彩色图像并实现高精度分类，对传统机器学习方法构成显著挑战。这要求模型具备强大的特征提取能力，并能有效理解图像的空间结构和色彩信息。卷积神经网络（CNN）凭借其独特的结构特性（如局部连接、权值共享）和分层特征提取机制，在处理图像数据方面展现出卓越优势，已成为解决复杂图像识别任务的核心架构。掌握CNN在CIFAR-10上的应用，是理解深度学习图像处理原理的关键一步。

本项目旨在通过下载并使用CIFAR-10数据集，构建并训练一个卷积神经网络模型，实现对其彩色图像的精确识别与分类。这不仅是对深度学习基础理论的实践演练，更是通向解决更复杂现实世界视觉问题的重要基石。项目将深化对CNN工作机制的理解，为后续探索先进视觉模型和实际应用提供坚实的技术基础。

✨ 数据集说明 ✨

CIFAR-10（Canadian Institute For Advanced Research）是计算机视觉领域的经典基准数据集，专为图像分类任务设计，具有以下关键特性：

1. 数据构成

图像数量：60,000张彩色图像
类别数量：10个互斥类别，分别对应标签值0-9
飞机（airplane）、汽车（automobile）、鸟类（bird）、猫（cat）、鹿（deer）、狗（dog）、青蛙（frog）、马（horse）、船（ship）、卡车（truck）
数据划分：
- 训练集：50,000张
- 测试集：10,000张

2. 图像特性

尺寸：32×32像素（极低分辨率）
通道：RGB彩色三通道
内容：物体居中显示，背景简单，但包含视角、光照、姿态等自然变化

A. 业务分析（30%）

评估目标

评估学生理解业务需求、分析数据基本情况。

实操任务

数据获取与初步处理（15分）

从Keras中导入Cifar-10数据集（5分）
- （1）导入 TensorFlow 、numpy、matplotlib.pyplot模块。（3分）
- （2）从 Keras 中导入Cifar-10数据集。（2分）
数据预处理（10分）
- （1）通过load_data()方法，训练集的特征值和标签值分别存储在 x_train 和 y_train 中，将测试集的特征值和标签值分别存储在 x_test 和 y_test 中。（4分）
- （2）将特征值x_train和x_test的数据类型转换为tf.float32，并进行标准化处理，使其取值范围为0～1。（4分）
- （3）将标签值y_train和y_test的数据类型转换为tf.int32。（2分）

Cifar-10数据集数据探索分析（10分）

检查数据集基本情况（6分）
- （1）显示数据集的特征值x_train、x_test和标签值y_train、y_test的shape属性值。（4分）
- （2）显示数据集的特征值x_train和标签值y_train的数据类型属性值。（2分）
Cifar-10数据集统计分析（4分）
- （1）统计各类别样本数量。（2分）
- （2）计算像素值统计信息。（2分）

关键信息提取（5分）

根据数据集的shape属性值、各类别样本数量等信息具体说明Cifar-10各类别数据基本情况分布。（5分）

A.1.1 从Keras中导入Cifar-10数据集

（1）导入 TensorFlow 、numpy、matplotlib.pyplot模块。

import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt

e:\anaconda3\envs\rag_env\Lib\site-packages\keras\src\export\tf2onnx_lib.py:8: FutureWarning: In the future `np.object` will be defined as the corresponding NumPy scalar.
if not hasattr(np, "object"):

（2）从 Keras 中导入Cifar-10数据集。

from tensorflow.keras.datasets import cifar10

A.1.2 数据预处理

（1）通过load_data()方法，训练集的特征值和标签值分别存储在 x_train 和 y_train 中，将测试集的特征值和标签值分别存储在 x_test 和 y_test 中

(x_train, y_train), (x_test, y_test) = tf.keras.datasets.cifar10.load_data()

Downloading data from https://www.cs.toronto.edu/~kriz/cifar-10-python.tar.gz
[1m170498071/170498071[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m45s[0m 0us/step

（2）将特征值x_train和x_test的数据类型转换为tf.float32，并进行标准化处理，使其取值范围为0～1。

x_train = tf.cast(x_train, tf.float32) / 255.0
x_test = tf.cast(x_test, tf.float32) / 255.0

（3）将标签值y_train和y_test的数据类型转换为tf.int32。

y_train = tf.cast(y_train, tf.int32)
y_test = tf.cast(y_test, tf.int32)

A.2.1 检查数据集基本情况

（1）显示数据集的特征值x_train、x_test和标签值y_train、y_test的shape属性值。

print("x_train.shape=", x_train.shape)
print("y_train.shape=", y_train.shape)
print("x_test.shape=", x_test.shape)
print("y_test.shape=", y_test.shape)

x_train.shape= (50000, 32, 32, 3)
y_train.shape= (50000, 1)
x_test.shape= (10000, 32, 32, 3)
y_test.shape= (10000, 1)

（2）显示数据集的特征值x_train和标签值y_train的数据类型属性值。

print("x_test的数据类型：", x_train.dtype)
print("y_test的数据类型：", y_train.dtype)

x_test的数据类型： <dtype: 'float32'>
y_test的数据类型： <dtype: 'int32'>

A.2.2 Cifar-10数据集统计分析

（1）统计各类别样本数量。

def count_classes(labels):
unique, counts = np.unique(labels, return_counts=True)
return dict(zip(unique, counts))

print("训练集类别分布：", count_classes(y_train.numpy().flatten()))
print("测试集类别分布：", count_classes(y_test.numpy().flatten()))

训练集类别分布： {np.int32(0): np.int64(5000), np.int32(1): np.int64(5000), np.int32(2): np.int64(5000), np.int32(3): np.int64(5000), np.int32(4): np.int64(5000), np.int32(5): np.int64(5000), np.int32(6): np.int64(5000), np.int32(7): np.int64(5000), np.int32(8): np.int64(5000), np.int32(9): np.int64(5000)}
测试集类别分布： {np.int32(0): np.int64(1000), np.int32(1): np.int64(1000), np.int32(2): np.int64(1000), np.int32(3): np.int64(1000), np.int32(4): np.int64(1000), np.int32(5): np.int64(1000), np.int32(6): np.int64(1000), np.int32(7): np.int64(1000), np.int32(8): np.int64(1000), np.int32(9): np.int64(1000)}

（2）计算像素值统计信息。

# 计算像素值统计信息
print("\n像素值统计：")
print("训练集的最小值:", np.min(x_train))
print("训练集的最大值:", np.max(x_train))
print("训练集的均值:", np.mean(x_train))
print("训练集的标准差:", np.std(x_train))

像素值统计：
训练集的最小值: 0.0
训练集的最大值: 1.0
训练集的均值: 0.473363
训练集的标准差: 0.25156894

A.3.1 根据数据集的shape属性值、各类别样本数量等信息具体说明Cifar-10各类别数据基本情况分布

CIFAR-10 数据集共包含 60,000 张 32×32 的 RGB 彩色图像，分为 10 个互斥类别（飞机、汽车、鸟、猫、鹿、狗、青蛙、马、船、卡车）。

训练集：50,000 张，每类 5,000 张，完全均衡。
测试集：10,000 张，每类 1,000 张，同样均衡。
图像尺寸小（32×32），但包含丰富的姿态、光照和背景变化，对模型泛化能力构成挑战。
像素值范围为 [0, 255]，经归一化后为 [0, 1]，均值约为 0.47，标准差约 0.25。

B. 智能训练（40%）

评估目标 评估学生对数据的处理和应用深度学习方法的能力。

实操任务

构建卷积神经网络模型（32分）
图像识别分类网络模型采用卷积神经网络，包括两个卷积层、两个池化层、4个Dropout层、一个拉伸层、两个全连接层和一个输出层，网络结构如图所示。 image.png
- （1）通过Sequential（）构建卷积神经网络模型对象model。(1分)
- （2）在model对象中添加第一组“卷积层+池化层+Dropout层”，包括添加卷积层，输出通道数为32，卷积核大小为3×3，填充方式为’same’，使用ReLU函数作为激活函数；然后添加最大池化层，池化窗口大小为2×2，步长大小为(1,1)，填充方式为’same’；最后添加Dropout层，丢弃概率为0.2。(6分)
- （3）在model对象中添加第二组“卷积层+池化层+Dropout层”，包括添加卷积层，输出通道数为64，卷积核大小为3×3，填充方式为’same’，使用ReLU函数作为激活函数；然后添加最大池化层，池化窗口大小为2×2，步长大小为(1,1)，填充方式为’same’；最后添加Dropout层，丢弃概率为0.2。(6分)
- （4）在model对象中添加拉伸层。(3分)
- （5）在model对象中添加全连接层，神经元个数为512，使用ReLU函数作为激活函数。(3分)
- （6）在model对象中添加Dropout层，丢弃概率为0.2。(3分)
- （7）在model对象中添加全连接层，神经元个数为256，使用ReLU函数作为激活函数。(3分)
- （8）在model对象中添加Dropout层，丢弃概率为0.5。(3分)
- （9）在model对象中添加输出层，Cifar-10数据集是10分类问题，因此输出层有10个神经元，激活函数采用Softmax函数。(3分)
- （10）通过summary()显示模型参数信息。(1分)
编译、训练和评估卷积神经网络模型（8分）
- （1）编译网络模型，其中，优化器使用Adam优化器，损失函数使用稀疏交叉熵损失函数，性能评估函数使用稀疏交叉熵准确率函数。（4分）
- （2）训练网络模型，并将训练结果保存在history中。设置批量的大小为128，迭代次数为10，验证集的数据占比为0.2。（2分）
- （3）使用测试集数据对网络模型进行评估，其中，设置批量的大小为64，日志显示模式verbose为2。（2分）

B.1 构建卷积神经网络模型

（1）通过Sequential（）构建卷积神经网络模型对象model。

model = tf.keras.Sequential()

（2）在model对象中添加第一组“卷积层+池化层+Dropout层”，包括添加卷积层Conv2D（），输出通道数为32，卷积核大小为3×3，填充方式padding为’same’，使用ReLU函数作为激活函数，输入数据的形状为input_shape=x_train.shape[1:]；然后添加最大池化层MaxPool2D（），池化窗口pool_size大小为2×2，步长strides大小为(1,1)，填充方式为’same’；最后添加Dropout层，丢弃概率为0.2。

# 使用add()函数逐层添加网络层
model.add(tf.keras.layers.Conv2D(32, (3, 3), padding='same', activation='relu', input_shape=x_train.shape[1:]))
model.add(tf.keras.layers.MaxPool2D(pool_size=(2, 2), strides=(1, 1), padding='same'))
model.add(tf.keras.layers.Dropout(0.2))

e:\anaconda3\envs\rag_env\Lib\site-packages\keras\src\layers\convolutional\base_conv.py:113: UserWarning: Do not pass an `input_shape`/`input_dim` argument to a layer. When using Sequential models, prefer using an `Input(shape)` object as the first layer in the model instead.
super().__init__(activity_regularizer=activity_regularizer, **kwargs)

（3）在model对象中添加第二组“卷积层+池化层+Dropout层”，包括添加卷积层，输出通道数为64，卷积核大小为3×3，填充方式为’same’，使用ReLU函数作为激活函数；然后添加最大池化层，池化窗口大小为2×2，步长大小为(1,1)，填充方式为’same’；最后添加Dropout层，丢弃概率为0.2。

model.add(tf.keras.layers.Conv2D(64, (3, 3), padding='same', activation='relu'))
model.add(tf.keras.layers.MaxPool2D(pool_size=(2, 2), strides=(1, 1), padding='same'))
model.add(tf.keras.layers.Dropout(0.2))

（4）在model对象中添加拉伸层Flatten()层。

model.add(tf.keras.layers.Flatten())

（5）在model对象中添加全连接层，神经元个数为512，使用ReLU函数作为激活函数。

model.add(tf.keras.layers.Dense(512, activation='relu'))

（6）在model对象中添加Dropout层，丢弃概率为0.2。

model.add(tf.keras.layers.Dropout(0.2))

（7）在model对象中添加全连接层，神经元个数为256，使用ReLU函数作为激活函数。

model.add(tf.keras.layers.Dense(256, activation='relu'))

（8）在model对象中添加Dropout层，丢弃概率为0.5。

model.add(tf.keras.layers.Dropout(0.5))

（9）在model对象中添加输出层，Cifar-10数据集是10分类问题，因此输出层有10个神经元，激活函数采用Softmax函数。

model.add(tf.keras.layers.Dense(10, activation='softmax'))

（10）通过summary()显示模型参数信息。

model.summary()

B.2 编译、训练和评估卷积神经网络模型

（1）编译网络模型，其中，优化器使用Adam优化器，损失函数使用稀疏交叉熵损失函数SparseCategoricalCrossentropy，性能评估函数使用稀疏交叉熵准确率函数sparse_categorical_accuracy。

#编译网络模型（重要参数，optimizer,loss,metrics）
model.compile(
    optimizer='adam',
    loss=tf.keras.losses.SparseCategoricalCrossentropy(),
    metrics=['sparse_categorical_accuracy']
)

（2）训练网络模型，并将训练结果保存在history中。设置批量的大小为128，迭代次数为10，验证集的数据占比validation_split为0.2。

#训练网络模型
history = model.fit(
    x_train, y_train,
    batch_size=128,
    epochs=10,
    validation_split=0.2,
    verbose=1
)

Epoch 1/10
[1m313/313[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m71s[0m 223ms/step - loss: 1.8371 - sparse_categorical_accuracy: 0.3446 - val_loss: 1.3610 - val_sparse_categorical_accuracy: 0.5170
Epoch 2/10
[1m313/313[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m77s[0m 246ms/step - loss: 1.3006 - sparse_categorical_accuracy: 0.5367 - val_loss: 1.1700 - val_sparse_categorical_accuracy: 0.5871
Epoch 3/10
[1m313/313[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m68s[0m 218ms/step - loss: 1.1094 - sparse_categorical_accuracy: 0.6065 - val_loss: 1.0569 - val_sparse_categorical_accuracy: 0.6276
Epoch 4/10
[1m313/313[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m70s[0m 223ms/step - loss: 0.9630 - sparse_categorical_accuracy: 0.6610 - val_loss: 0.9826 - val_sparse_categorical_accuracy: 0.6555
Epoch 5/10
[1m313/313[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m83s[0m 228ms/step - loss: 0.8455 - sparse_categorical_accuracy: 0.7048 - val_loss: 0.9454 - val_sparse_categorical_accuracy: 0.6769
Epoch 6/10
[1m313/313[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m82s[0m 262ms/step - loss: 0.7422 - sparse_categorical_accuracy: 0.7388 - val_loss: 0.9193 - val_sparse_categorical_accuracy: 0.6899
Epoch 7/10
[1m313/313[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m87s[0m 279ms/step - loss: 0.6443 - sparse_categorical_accuracy: 0.7741 - val_loss: 0.9138 - val_sparse_categorical_accuracy: 0.6940
Epoch 8/10
[1m313/313[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m73s[0m 235ms/step - loss: 0.5352 - sparse_categorical_accuracy: 0.8140 - val_loss: 0.9563 - val_sparse_categorical_accuracy: 0.7033
Epoch 9/10
[1m313/313[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m96s[0m 308ms/step - loss: 0.4713 - sparse_categorical_accuracy: 0.8368 - val_loss: 0.9716 - val_sparse_categorical_accuracy: 0.7038
Epoch 10/10
[1m313/313[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m152s[0m 338ms/step - loss: 0.3992 - sparse_categorical_accuracy: 0.8606 - val_loss: 1.0937 - val_sparse_categorical_accuracy: 0.6928

（3）使用测试集数据对网络模型进行评估，其中，设置批量的大小为64，日志显示模式verbose为2。

#评估网络模型
test_loss, test_acc = model.evaluate(x_test, y_test, batch_size=64, verbose=2)
print(f"准确率: {test_acc:.4f}")

157/157 - 4s - 24ms/step - loss: 1.1371 - sparse_categorical_accuracy: 0.6773
准确率: 0.6773

C. 智能系统设计（25%）

评估目标

评估学生人机交互、应用网络模型的能力。

实操任务

图像展示（5分）

Cifar-10数据集部分图像进行展示（5分）
- （1）查看训练集中10张图片，生成随机整数n，n代表测试集中选中数据的下标。设置不显示坐标轴，设置plt.rcParams[‘font.sans-serif’]为SimHei。通过plt.imshow()方法绘制图像，标题显示标签值。（5分）

可视化训练的结果（8分）

通过读取history的history属性赋值（4分）
- （1）读取history的history属性，分别将训练集损失函数值赋值给变量loss、训练集准确率赋值给变量acc、验证集损失函数值赋值给变量val_loss、验证集准确率赋值给变量val_acc。（4分）
绘制损失函数与准确率的折线图（4分）
- （1）创建子图，在子图1中绘制损失函数值的折线图。（2分）
- （2）在子图2中绘制准确率的折线图，显示图形。（2分）

应用卷积神经网络模型（12分）

在测试集中随机选择10张图片，使用训练完成的卷积神经网络模型进行预测。
- （1）创建画布，使用随机函数生成随机整数赋值给变量n，n代表测试集中选中数据的下标。（2分）
- （2）设置不显示坐标轴，设置plt.rcParams[‘font.sans-serif’]为SimHei。（2分）
- （3）将测试数据维度改为(1,32,32,3)，并赋值给demo。（2分）
- （4）应用网络模型得到概率最大的下标，即预测值。（2分）
- （5）创建子图，在子图中绘制测试图像，并在子图标题上显示标签值和预测值，最后显示图形。（4分）

C.1 Cifar-10数据集部分图像进行展示

（1）查看训练集中10张图片，生成随机整数n，n代表测试集中选中数据的下标。设置不显示坐标轴，设置plt.rcParams[‘font.sans-serif’]为SimHei。通过plt.imshow()方法绘制图像，标题显示标签值。

plt.figure()
for i in range(10):
    n=np.random.randint(1,len(x_train))             #生成随机整数n
    plt.subplot(2,5,i+1)                        #创建子图
    plt.axis("off")                             #设置不显示坐标轴
    plt.rcParams['font.sans-serif']=['SimHei']
    plt.imshow(x_train[n])          #绘制图像
    title="标签值："+str((y_train.numpy())[n,0])
    plt.title(title)                            #设置子图标题
plt.show()                                      #显示图形

png

png

C.2.1 通过读取history的history属性赋值

（1）读取history的history属性，分别将训练集损失函数值赋值给变量loss、训练集准确率赋值给变量acc、验证集损失函数值赋值给变量val_loss、验证集准确率赋值给变量val_acc。

#读取history的history属性
loss = history.history['loss']
acc = history.history['sparse_categorical_accuracy']
val_loss = history.history['val_loss']
val_acc = history.history['val_sparse_categorical_accuracy']

C.2.2 绘制损失函数与准确率的折线图

（1）创建子图，在子图1中绘制损失函数值的折线图。

#创建画布并设置画布的大小
plt.figure(figsize=(10,3))
#在子图1中绘制损失函数值的折线图

plt.subplot(1, 2, 1)
plt.plot(loss, label='训练损失')
plt.plot(val_loss, label='验证损失')
plt.title('损失函数变化')
plt.xlabel('轮次')
plt.ylabel('损失值')
plt.legend()

plt.show()

png

png

（2）在子图2中绘制准确率的折线图，显示图形。

#在子图2中绘制准确率的折线
plt.subplot(1, 2, 2)
plt.plot(acc, label='训练准确率')
plt.plot(val_acc, label='验证准确率')
plt.title('准确率')
plt.xlabel('轮次')
plt.ylabel('准确率')
plt.legend()

plt.show()

png

png

C.3.3 在测试集中随机选择10张图片，使用训练完成的卷积神经网络模型进行预测。

- （1）创建画布，使用随机函数生成随机整数赋值给变量n，n代表测试集中选中数据的下标。
- （2）设置不显示坐标轴，设置plt.rcParams['font.sans-serif']为SimHei。
- （3）将测试数据维度改为(1,32,32,3)，并赋值给demo。
- （4）应用网络模型得到概率最大的下标，即预测值。
- （5）创建子图，在子图中绘制测试图像，并在子图标题上显示标签值和预测值，最后显示图形。

plt.figure()
for i in range(10):
    n=np.random.randint(1,len(x_test))              #生成随机整数n
    plt.subplot(2,5,i+1)                        #创建子图
    plt.axis("off")                             #设置不显示坐标轴
    plt.rcParams['font.sans-serif']=['SimHei']
    plt.imshow(x_test[n],cmap='gray')           #绘制图像
    demo = tf.reshape(x_test[n], (1, 32, 32, 3))
    y_pred=np.argmax(model.predict(demo))     #应用网络模型
    title="标签值："+str((y_test.numpy())[n,0])+"\n预测值："+str(y_pred)
    plt.title(title)                            #设置子图标题
plt.show()                                      #显示图形

[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 57ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 35ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 27ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 36ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 24ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 26ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 29ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 28ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 34ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 36ms/step

png

png

D. 培训与指导模块（5%）

评估目标

评估学生进行知识传递与模型解释的能力。

实操任务
- 以 markdown 格式编写卷积神经网络模型相比于全连接神经网络的优点、核心网络层、提升网络模型准确率的方法等。（5分）

D.1 以 markdown 格式编写卷积神经网络模型相比于全连接神经网络的优点、核心网络层、提升网络模型准确率的方法等。

参见“卷积神经网络模型理解.md”

卷积神经网络（CNN） vs 全连接神经网络（FCN）

一、CNN 相比于全连接网络的优点

参数共享：卷积核在整张图像上滑动，共享权重，大幅减少参数量。
稀疏连接：每个输出只与局部输入区域连接，降低计算复杂度。
平移不变性：能识别图像中任意位置的特征（如边缘、纹理）。
自动特征提取：无需人工设计特征，通过多层卷积学习层次化特征表示。
适合处理高维数据：尤其适用于图像、视频等具有空间结构的数据。

二、CNN 的核心网络层

层类型	功能说明
卷积层（Conv2D）	提取局部特征，使用可学习的滤波器扫描输入
激活函数（ReLU）	引入非线性，增强模型表达能力
池化层（MaxPooling）	降采样，减少参数、防止过拟合、增强鲁棒性
全连接层（Dense）	将高维特征映射到类别空间，用于最终分类
Dropout 层（可选）	随机失活神经元，提升泛化能力