《Day1:AI 初探与 PyTorch 入门：深度学习.Torch框架基础》

本文介绍了人工智能基础知识和PyTorch深度学习框架。首先概述AI的定义、实现要素（数据、网络、算力）及产业生态。重点讲解PyTorch框架：它是由Facebook开发的Python深度学习框架，具有灵活高效、支持GPU加速等特点，提供自动微分等高级功能。文章对比了TensorFlow、Keras等其他主流框架，并指出PyTorch是经典的首选框架。通过本阶段学习可为后续模型训练打下基础。

xw3373409564

654人浏览 · 2025-08-06 18:56:57

xw3373409564 · 2025-08-06 18:56:57 发布

一、认识人工智能

大国的游戏，政府支持到位，是未来；

1. 人工智能是什么

AI : Artificial Intelligence，旨在研究、开发能够模拟、延伸和扩展人类智能的理论、方法、技术及应用系统，是一种拥有自主学习和推理能力的技术。它模仿人类大脑某些功能，包括感知、学习、理解、决策和问题解决。

AI本质

本质是数学计算
数学是理论关键
计算机是实现关键：算力
新的有效算法，需要更大的算力

NLP（说话，听）、CV（眼睛）、自动驾驶、机器人（肢体动作）、大模型

2. 人工智能实现过程

三要素：数据、网络、算力

① 神经网络：找到合适的数学公式；

② 训练：用已有数据训练网络，目标是求最优解；

③ 推理：用模型预测新样本；

3. 术语关系图

4. AI产业大生态

二、初识Torch

PyTorch，简称Torch，主流的经典的深度学习框架，如果你只想掌握一个深度学习框架，那就毫不犹豫的选择他吧！

翻译：用Torch进行深度学习。

通过本阶段的学习, 各位大佬将熟练掌握PyTorch的使用，为后续学习网络搭建、模型训练等打下基础。

1. 生涩的简介

PyTorch是一个基于Python的深度学习框架，它提供了一种灵活、高效、易于学习的方式来实现深度学习模型。PyTorch最初由Facebook开发，被广泛应用于计算机视觉、自然语言处理、语音识别等领域。

PyTorch使用张量（tensor）来表示数据，可以轻松地处理大规模数据集，且可以在GPU上加速。

PyTorch提供了许多高级功能，如自动微分（automatic differentiation）、自动求导（automatic gradients）等，这些功能可以帮助我们更好地理解模型的训练过程，并提高模型训练效率。

2. 多彩的江湖

除了PyTorch，还有很多其它常见的深度学习框架：

TensorFlow： Google开发，广泛应用于学术界和工业界。TensorFlow提供了灵活的构建、训练和部署功能，并支持分布式计算。
Keras： Keras是一个高级神经网络API，已整合到TensorFlow中。
PaddlePaddle： PaddlePaddle（飞桨）是百度推出的开源深度学习平台，旨在为开发者提供一个易用、高效的深度学习开发框架。
MXNet：由亚马逊开发，具有高效的分布式训练支持和灵活的混合编程模型。
Caffe：具有速度快、易用性高的特点，主要用于图像分类和卷积神经网络的相关任务。
CNTK ：由微软开发的深度学习框架，提供了高效的训练和推理性能。CNTK支持多种语言的接口，包括Python、C++和C#等。
Chainer：由Preferred Networks开发的开源深度学习框架，采用动态计算图的方式。

三、Tensor概述

PyTorch会将数据封装成张量（Tensor）进行计算，所谓张量就是元素为相同类型的多维矩阵。

张量可以在 GPU 上加速运行。

1. 概念

张量是一个多维数组，通俗来说可以看作是扩展了标量、向量、矩阵的更高维度的数组。张量的维度决定了它的形状（Shape），例如：

标量是 0 维张量，如 a = torch.tensor(5)
向量是 1 维张量，如 b = torch.tensor([1, 2, 3])
矩阵是 2 维张量，如 c = torch.tensor([[1, 2], [3, 4]])
更高维度的张量，如3维、4维等，通常用于表示图像、视频数据等复杂结构。

2. 特点

动态计算图：PyTorch 支持动态计算图，这意味着在每一次前向传播时，计算图是即时创建的。
GPU 支持：PyTorch 张量可以通过 .to('cuda') 移动到 GPU 上进行加速计算。
自动微分：通过 autograd 模块，PyTorch 可以自动计算张量运算的梯度，这对深度学习中的反向传播算法非常重要。

3. 数据类型

PyTorch中有3种数据类型：浮点数、整数、布尔。其中，浮点数和整数又分为8位、16位、32位、64位，加起来共9种。

为什么要分为8位、16位、32位、64位呢？

场景不同，对数据的精度和速度要求不同。通常，移动或嵌入式设备追求速度，对精度要求相对低一些。精度越高，往往效果也越好，自然硬件开销就比较高。

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

《解密！AI应用架构师眼中企业元宇宙运营方案的策略》

在当今数字化飞速发展的时代，元宇宙概念如同一颗重磅炸弹，在商业领域掀起了层层巨浪。元宇宙不再仅仅是科幻作品中的遥远想象，它正逐步走进现实，成为众多企业竞相探索的新领域。从游戏行业到时尚界，从教育领域到金融行业，元宇宙为企业提供了前所未有的机遇和挑战。企业希望借助元宇宙构建全新的商业模式、拓展用户群体、提升品牌影响力。然而，要在元宇宙这片新兴领域成功运营并非易事，需要全面且独特的策略。对于 AI 应