全过程带你学Pytorch《动手学PyTorch深度学习建模与应用》第一章：总结回顾

深度学习是机器学习的一个分支，它通过构建多层神经网络来学习数据中的复杂模式。PyTorch是一个开源的深度学习框架，以其灵活性和易用性而受到广泛欢迎。PyTorch的核心特性包括动态计算图、自动求导机制和丰富的API。容易出错的地方动态计算图与静态计算图的区别：动态计算图允许在运行时动态修改计算图，这使得调试更加灵活，但也可能导致性能问题。相比之下，静态计算图（如TensorFlow 1.x）在运

环工人学Python

679人浏览 · 2025-03-04 21:16:30

环工人学Python · 2025-03-04 21:16:30 发布

写在前面，不好意思各位，最近忙吐了，更新的有点迟了，依旧感谢CSDN平台，以及所有热爱点赞！收藏！和关注的你！请求关注呀！~

往期文章：

第一章链接点击直达，快来复习哦

1.4-1.7部分内容：教你动手学Pytorch，从入门到精通:《动手学PyTorch深度学习建模与应用》第1章解读：PyTorch入门与张量操作

1.8-1.9详解回顾

在这一章中，我们深入学习了PyTorch的基础知识，包括深度学习的基本概念、PyTorch的安装与配置、张量操作、自动求导机制、神经网络模块化设计等。这些内容为后续的深度学习建模打下了坚实的基础。现在，让我们回顾一下这一章的重点内容，并特别关注那些容易出错的部分。

1.1 深度学习与PyTorch简介

第一章链接点击直达，快来复习哦

深度学习是机器学习的一个分支，它通过构建多层神经网络来学习数据中的复杂模式。PyTorch是一个开源的深度学习框架，以其灵活性和易用性而受到广泛欢迎。PyTorch的核心特性包括动态计算图、自动求导机制和丰富的API。

容易出错的地方：

动态计算图与静态计算图的区别：动态计算图允许在运行时动态修改计算图，这使得调试更加灵活，但也可能导致性能问题。相比之下，静态计算图（如TensorFlow 1.x）在运行前需要构建完整的计算图，调试相对复杂，但运行效率更高。

建议：

如果你对动态计算图和静态计算图的区别还不清楚，可以尝试对比PyTorch和TensorFlow 1.x的代码实现，理解它们的差异。

1.2 PyTorch的安装与环境配置

安装PyTorch时，需要根据你的系统配置（如操作系统、CUDA版本）选择合适的安装命令。PyTorch支持多种安装方式，包括通过pip和conda。

容易出错的地方：

CUDA版本不匹配：如果你的系统中安装了不匹配的CUDA版本，可能会导致PyTorch无法正常运行。
安装命令选择错误：选择错误的安装命令可能会导致安装失败或性能问题。

建议：

在安装PyTorch之前，确保你的系统中安装了正确的CUDA版本。访问PyTorch官网，根据你的系统配置选择合适的安装命令。、

1.3 张量（Tensor）基础

张量是PyTorch中最基本的数据结构，类似于NumPy的数组，但可以利用GPU进行计算。张量支持多种操作，包括加法、乘法、切片等。

容易出错的地方：

张量的形状（Shape）问题：在进行张量操作时，形状不匹配是一个常见的错误。例如，在进行矩阵乘法时，需要确保张量的形状是兼容的。
GPU与CPU之间的张量转换：如果你的系统支持CUDA，需要确保张量在GPU和CPU之间正确转换。

建议：

在进行张量操作之前，使用tensor.shape检查张量的形状，确保它们是兼容的。
使用tensor.to(device)将张量移动到GPU或CPU。例如：

device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
tensor = tensor.to(device)

1.4 自动求导机制

1.4-1.7部分内容：教你动手学Pytorch，从入门到精通:《动手学PyTorch深度学习建模与应用》第1章解读：PyTorch入门与张量操作

自动求导是PyTorch的核心特性之一，它允许用户自动计算张量的梯度。通过设置requires_grad=True，PyTorch会自动跟踪张量的操作，并在需要时计算梯度。

容易出错的地方：

requires_grad属性的使用：忘记设置requires_grad=True会导致无法计算梯度。
backward()方法的调用：backward()方法只能在标量张量上调用。如果需要对非标量张量计算梯度，需要传递一个与张量形状相同的权重张量。

建议：

在定义需要求导的张量时，确保设置了requires_grad=True。
如果需要对非标量张量计算梯度，可以使用以下方式：

loss = criterion(outputs, targets)
loss.backward(torch.ones_like(loss))

1.5 神经网络模块化设计

PyTorch通过torch.nn模块提供了强大的模块化设计功能，用户可以轻松构建复杂的神经网络。torch.nn.Module是所有神经网络模块的基类，用户可以通过继承该类来定义自己的网络。

容易出错的地方：

forward方法的定义：在定义forward方法时，需要确保输入和输出的形状是正确的。
模块的初始化：在定义网络时，需要正确初始化网络的各个层。

建议：

在定义forward方法时，使用print语句或调试工具检查中间张量的形状，确保它们是正确的。
使用torch.nn.init模块初始化网络的权重和偏置。例如：

torch.nn.init.xavier_uniform_(self.fc1.weight)
torch.nn.init.zeros_(self.fc1.bias)

1.6 广播机制

广播机制允许PyTorch对形状不同的张量进行按元素运算。当两个张量的形状不匹配时，PyTorch会自动扩展较小的张量，使其形状与较大的张量一致。

容易出错的地方：

广播规则的理解：广播规则可能比较复杂，容易导致形状不匹配的错误。
广播机制的滥用：在某些情况下，广播机制可能会导致不必要的内存消耗。

建议：

在使用广播机制时，仔细检查张量的形状，确保它们符合广播规则。
如果可能，尽量避免使用广播机制，改用显式的张量操作。

1.7 数据加载与预处理

PyTorch通过torch.utils.data.Dataset和torch.utils.data.DataLoader提供了强大的数据加载和预处理功能。这些工具可以帮助用户高效地加载和处理数据。

容易出错的地方：

Dataset类的实现：在实现自定义Dataset类时，需要正确实现__getitem__和__len__方法。
数据增强的使用：在使用数据增强时，需要确保增强后的数据与原始数据的形状一致。

建议：

在实现自定义Dataset类时，仔细检查__getitem__和__len__方法的实现，确保它们是正确的。
使用torchvision.transforms模块实现数据增强，确保增强后的数据与原始数据的形状一致。

1.8 模型训练与评估基础

1.8-1.9详解回顾

模型训练是深度学习的核心环节，它通过优化算法调整模型参数，使模型在训练数据上表现良好。模型评估则是通过验证集或测试集来衡量模型的泛化能力。

容易出错的地方：

优化器的选择：选择不合适的优化器可能会导致模型无法收敛。
损失函数的选择：选择不合适的损失函数可能会导致模型性能不佳。

建议：

在选择优化器时，根据任务类型选择合适的优化器。例如，对于复杂的深度学习任务，推荐使用Adam优化器。
在选择损失函数时，根据任务类型选择合适的损失函数。例如，对于分类任务，推荐使用交叉熵损失函数。

1.9 总结与实践案例

在这一章中，我们通过实践案例巩固了所学内容。这些实践案例包括手写数字识别（MNIST数据集）等，帮助我们更好地理解和应用PyTorch进行深度学习建模。

容易出错的地方：

模型的保存与加载：在保存和加载模型时，需要确保模型的结构与保存时一致。
模型的评估指标：在评估模型时，需要选择合适的评估指标。例如，对于分类任务，可以使用准确率、召回率、F1分数等。

建议：

在保存和加载模型时，使用torch.save和torch.load保存和加载模型的state_dict。例如：

torch.save(model.state_dict(), "model.pth")
model.load_state_dict(torch.load("model.pth"))

在评估模型时，根据任务类型选择合适的评估指标。例如，对于分类任务，可以使用以下代码计算准确率：

from sklearn.metrics import accuracy_score

all_preds = []
all_labels = []
with torch.no_grad():
    for inputs, targets in test_loader:
        outputs = model(inputs)
        _, predicted = torch.max(outputs, 1)
        all_preds.extend(predicted.numpy())
        all_labels.extend(targets.numpy())

accuracy = accuracy_score(all_labels, all_preds)
print(f"Test Accuracy: {accuracy:.4f}")