Day26_【深度学习（6）—神经网络NN（1）重点概念浓缩、前向传播】

l12345sy · 2025-09-18 21:18:53 发布

——单个神经元

人工神经网络（Artificial Neural Network，简写为ANN）也简称为神经网络（NN），是一种模仿生物神经网络结构和功能的计算模型

——单个神经元

——多个神经元

深度学习中神经网络的目的就是为了自动提取特征

主要是针对有监督学习（更多的是分类问题）

使用神经网络：只做特征提取，不会改变输入的样本数

神经网络：

背景：输入的数据也就是特征，实际是有一定规律的，初始化参数是为了让模型有“能力”去“学习并保存”这些规律，将规律复用

方法：

初始化类型	PyTorch 函数	适用场景
全零初始化	`nn.init.zeros_(tensor)`	一般不用于权重；可用于偏置（bias）初始化
全一初始化	`nn.init.ones_(tensor)`	多用于偏置或特定约束层
固定值初始化	`nn.init.constant_(tensor, val)`	自定义常数初始化，如设为 0.1、-1 等
均匀分布初始化	`nn.init.uniform_(tensor, a, b)`	通用初始化，需指定范围
正态分布初始化	`nn.init.normal_(tensor, mean, std)`	微调或自定义分布初始化
Kaiming 正态初始化	`nn.init.kaiming_normal_(tensor)`	ReLU 及其变体激活的层，深层网络推荐
Kaiming 均匀初始化	`nn.init.kaiming_uniform_(tensor)`	同上，使用均匀分布
Xavier 正态初始化	`nn.init.xavier_normal_(tensor)`	Sigmoid 或 Tanh 激活的层，浅层网络常用
Xavier 均匀初始化	`nn.init.xavier_uniform_(tensor)`	同上，使用均匀分布