pytorch中max函数的一点使用记录 max(-1)[1]

今天看一点在外人看来也许是非常简单的代码，但是越看越模糊，直到查了一些资料才基本搞明白。没办法，小白前进的路上总会有各种崎岖。相关代码链接：https://github.com/zergtant/pytorch-handbook/blob/master/chapter3/3.1-logistic-regression.ipynb首先，在数据准备阶段，作者使用german.data-nume...

开飞机的小毛驴儿

15045人浏览 · 2019-11-27 00:02:58

开飞机的小毛驴儿 · 2019-11-27 00:02:58 发布

今天看一点在外人看来也许是非常简单的代码，但是越看越模糊，直到查了一些资料才基本搞明白。没办法，小白前进的路上总会有各种崎岖。

首先，在数据准备阶段，作者使用german.data-numeric中的前900条用作训练，后100条用作测试，因此有如下代码：

train_data=data[:900,:l-1]
train_lab=data[:900,l-1]-1
test_data=data[900:,:l-1]
test_lab=data[900:,l-1]-1

注意，这里为什么需要在label中-1呢？打开原始数据看一下就明白了，主要原因是原始的数据标签范围是1和2，而在代码中使用的是sigmoid函数，其对应的范围是0-1，因此需要把原始的label-1.这不是最让我困惑的！

在测试集上计算准确率时，作者有如下代码：

def test(pred,lab):
    t=pred.max(-1)[1]==lab
    return torch.mean(t.float())

pred.max(-1)[1]是什么意思呢？注意原始网络的变换是nn.Linear(24,2)即由24个维度变换到2个维度，因此对每一个测试样本而言，其都会对应一个2维向量表示其属于第1维或第2维对应分类的概率。在批处理(batch)是情况下，神经网络的输出pred应该是样本个数*2的一个矩阵。因此，max(-1)中的-1表示按照最后一个维度（行）求最大值，即求每一个样本（每一行）概率的最大值。然后pred.max(-1)[1]中的方括号[1]则表示返回最大值的索引，即返回0或者1，正好与我们原始数据的label相对应。然后t=pred.max(-1)[1]==lab的返回值为一个长度为样本个数的0，1向量，最后return torch.mean(t.float())恰好为准确率的定义。

torch.max()[0]，只返回最大值的每个数

troch.max()[1]，只返回最大值的每个索引

也许是我太小白了，我觉得作者的代码写得很精妙！

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

上下文协议（MCP）Java SDK 指南

我们先通过这个类，定义一个非常简单的 MCP 工具，用来打印收到的提示词（prompt），该方法返回一个.build();});这里我们首先定义了输入的 JSON Schema，用来为用户输入建立一个清晰的契约。接着，使用该输入 Schema 来实例化一个Tool，在处理逻辑中提取出prompt参数，并最终返回包含该prompt的结果。在本文中，我们首先回顾了 MCP 及其 Java SDK 的整

2048 AI社区

【GPUS_Workshop】1.本地模型创建本地智能体

2048 AI社区

中篇：场景深耕——智能体如何重塑企业核心价值链

摘要本文系统阐述了AI智能体在企业战略决策、供应链、营销、客服等核心场景的应用价值。通过智能体集群构建"四维感知"决策体系，实现战略识别提前6个月；供应链智能体使库存周转天数缩短38%；营销智能体矩阵降低获客成本35%，提升转化率48%；客服智能体分流60%人工话务，满意度提升20%。案例显示，企业部署智能体后6个月内即可获得显著ROI，为数字化转型提供可复用的实施路径。关