Pytorch nn.KLDivLoss, reduction=‘none‘|‘mean‘|‘batchmean‘详解

Pytorch nn.KLDivLoss, reduction=‘none’|‘mean’|'batchmean’详解先看下官方文档https://pytorch.org/docs/stable/generated/torch.nn.KLDivLoss.html然后运行下这个例子import torchimport torch.nn as nnif __name__ == '__main__':x

Chenglin_Yu

3776人浏览 · 2021-12-21 11:14:52

Chenglin_Yu · 2021-12-21 11:14:52 发布

Pytorch nn.KLDivLoss, reduction=‘none’|‘mean’|'batchmean’详解

先看下官方文档

官方文档
 https://pytorch.org/docs/stable/generated/torch.nn.KLDivLoss.html
直接看官方文档即可。官方文档比本文讲解的更清楚。
在这里插入图片描述

然后运行下这个例子

import torch
import torch.nn as nn

if __name__ == '__main__':
    x = torch.tensor([[0.1,0.3,0.6],
                      [0.2,0.4,0.4]])
    y = torch.tensor([[0.3,0.2,0.5],
                      [0.2,0.7,0.1]])
    lxy_batchmean = nn.KLDivLoss(reduction = 'batchmean')(x,y)
    lxy_mean = nn.KLDivLoss(reduction='mean')(x,y)
    lxy_none = nn.KLDivLoss(reduction='none')(x,y)
    print(torch.sum(torch.sum(lxy_none,dim=1)) /2 )
    print(lxy_batchmean)
    print(torch.sum(lxy_none) / (2*3))
    print(lxy_mean)
    print(lxy_none)

output:

tensor(-1.2907)
tensor(-1.2907)
tensor(-0.4302)
tensor(-0.4302)
tensor([[-0.3912, -0.3819, -0.6466],
        [-0.3619, -0.5297, -0.2703]])

结论: batchmean是正确的KLDiv的计算方式。

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

Expect脚本实战：多条件匹配与防卡死技巧

在自动化测试和系统初始化中，我们常常使用 Expect 脚本来完成一系列交互操作，比如自动输入密码、监听输出并作出响应。然而，实际项目中可能遇到多步骤输出匹配的场景：只有在先匹配到某一行输出，再匹配到另一行输出时，才需要做出响应。同时，如果 “testX failed” 出现了，但 “set params error” 没有在合理时间内出现，不要卡死，而是打印警告并继续。这个写法的问题在于：如

2048 AI社区

AI模型版本控制的标签管理：架构师的技巧

在AI模型生命周期中，版本控制是保障模型可追溯性、协作效率与生产可靠性的核心环节。而标签管理作为版本控制的"语义接口"，其设计质量直接决定了团队对模型版本的理解、检索与复用能力。本文从架构师视角出发，结合第一性原理与MLOps实践，系统阐述AI模型标签管理的理论框架、架构设计、实现机制与高级考量。通过拆解标签的"唯一标识+语义描述"本质，提出四维标签模型。