pytorch函数之scatter()和scatter_()

前言这两个函数，其实本来有一个大佬写的比较清楚了，但是说实话，总是给忘具体使用细节。我还是自己写一个更清晰的吧。官方文档scatter_()scatter_(input, dim, index, src) → Tensor其实这样写会造成迷惑，建议这么按下面的理解：理解input.scatter_(dim, index, src) → Tensorinput: 我们需要插入数据的起源tensor；

模糊包

6167人浏览 · 2020-06-10 23:12:08

模糊包 · 2020-06-10 23:12:08 发布

前言

这两个函数，理清楚的人很清楚，不清楚的人很不清楚，建议直接看2.举例

官方文档

`scatter_()`

'官方定义'
scatter(input, dim, index, src) → Tensor

实际使用：如下面

input.scatter_(dim, index, src) → Tensor
'Or'
input.scatter(dim, index, src) → Tensor
'区别是scatter_函数不会回滚，使用后返回的就是更改后的input。而scatter是在内存中生成另外一个对象，不会覆盖原input'

input: 我们需要插入数据的起源tensor；也就是想要改变内部的tensor
dim：我们想要从哪个维度去改input数据
index：给出改的元素索引，也就是位置，说在“坐标”可能好理解一点。
src：准备好的插入到input中指定位置的数据。

总结：input.scatter_(dim, index, src)：从【src源数据】中获取的数据，按照【dim指定的维度】和【index指定的位置】，替换input中的数据。

2. 举例

先看代码

batch_size = 2
hidden_size = 8

src = torch.rand(batch_size, hidden_size)
input_ = torch.zeros(batch_size+1, hidden_size)
index = torch.LongTensor([[0,1,2,0,0,1,1,2],[2,0,0,1,2,1,1,1]])

print('src\n',src)
print('index\n',index)
print('input_\n',input_)
print('ans:\n',input_.scatter_(0, index, src))
'''
src
 tensor([[0.3304, 0.5643, 0.2362, 0.1929, 0.2400, 0.6672, 0.5217, 0.4471],
        [0.0433, 0.2996, 0.9913, 0.4336, 0.8540, 0.8522, 0.0408, 0.1014]])
index
 tensor([[0, 1, 2, 0, 0, 1, 1, 2],
        [2, 0, 0, 1, 2, 1, 1, 1]])
input_
 tensor([[0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0.]])
ans:
 tensor([[0.3304, 0.2996, 0.9913, 0.1929, 0.2400, 0.0000, 0.0000, 0.0000],
        [0.0000, 0.5643, 0.0000, 0.4336, 0.0000, 0.8522, 0.0408, 0.1014],
        [0.0433, 0.0000, 0.2362, 0.0000, 0.8540, 0.0000, 0.0000, 0.4471]])
'''

比如上述代码，dim=0代表按行赋值，那么index[1][3]=1，代表更改input中的[1]行；另外，index[1][3]对应的src[1][3]的值是0.4336；index[1][3]的[3]列，因此是把0.4336这个数值放入input中的[1][3]的位置。

如果还是不太清楚，我们把dim=1设定为按列

src = torch.rand(batch_size, hidden_size).transpose(0,1)
input_ = torch.zeros(batch_size+1, hidden_size).transpose(0,1)
index = torch.LongTensor([[0,1,2,0,0,1,1,2],[2,0,0,1,2,1,1,1]]).transpose(0,1)

print('src\n',src)
print('index\n',index)
print('input_\n',input_)
# print('ans:\n',input_.scatter_(0, index, src))
print('ans:\n',input_.scatter_(1, index, src))
'''
src
 tensor([[0.3504, 0.3369],
        [0.1163, 0.3850],
        [0.5554, 0.5531],
        [0.0440, 0.2904],
        [0.2444, 0.6650],
        [0.4698, 0.5640],
        [0.1331, 0.5830],
        [0.0408, 0.8508]])
index
 tensor([[0, 2],
        [1, 0],
        [2, 0],
        [0, 1],
        [0, 2],
        [1, 1],
        [1, 1],
        [2, 1]])
input_
 tensor([[0., 0., 0.],
        [0., 0., 0.],
        [0., 0., 0.],
        [0., 0., 0.],
        [0., 0., 0.],
        [0., 0., 0.],
        [0., 0., 0.],
        [0., 0., 0.]])
ans:
 tensor([[0.3504, 0.0000, 0.3369],
        [0.3850, 0.1163, 0.0000],
        [0.5531, 0.0000, 0.5554],
        [0.0440, 0.2904, 0.0000],
        [0.2444, 0.0000, 0.6650],
        [0.0000, 0.5640, 0.0000],
        [0.0000, 0.5830, 0.0000],
        [0.0000, 0.8508, 0.0408]])
'''

同上，举例： dim=1代表按列赋值， index[4][1]=2，代表行是[4]列是[2]，说明是把src[4][1]的值，赋值给input[4][2]

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

豆包复制粘贴如何不乱码

2048 AI社区

字节、OpenAI、Meta都在赌一件事

过去十年互联网公司一直想摆脱笨重的硬件，追求轻资产的软件模式，而现在，他们正不计成本地集体“返祖”。有没有发现，大厂都在布局自己的AI硬件产品。在达沃斯现场，OpenAI 的全球事务官克里斯·莱恩透露了一个最新消息，OpenAI 正在按计划推进，准备在 2026 年下半年推出首款 AI 硬件设备。这个消息让原本就焦躁不安的科技圈彻底炸了锅。这意味着，全球最顶尖的算法引擎开始进入硬件赛道，在中国，近

2048 AI社区

AI手机的终局，“读屏”还是“对话”？

之后不久，市场上出现了比调用无障碍权限更“领先”的路线，也就是AI助手拿到了手机厂商给自己的系统签名权限，从而通过进程注入，更丝滑、无感地模拟操作。由于数据流动是通过明确的接口进行的，是有据可查的，即便出了问题也可以追溯。而在于，它能否成为一个更聪明的“副驾驶”，在我们做决策时，提供更精准的信息、更周全的建议，最终把选择权交还给我们自己。目前行业内相对公认的路径是，GUI探路尚可，因为它会把智能体