Python-Pandas之Dataframe进行groupby之后重命名方法

在正常情况，我们是这样做分组统计的：dft = train_data.groupby('AdID').agg({'AdDate': ['nunique', 'unique']})得到的结果是这样的：列变成多行了，其实有两个方法可以设置：第一种，是重新命名列名：最简单直接的方式：dft.columns = pd.Series(['Count', 'List'])结果是这样的：已经改好了，直截了当，但

苏小败在路上

22009人浏览 · 2020-05-11 18:17:52

苏小败在路上 · 2020-05-11 18:17:52 发布

在正常情况，我们是这样做分组统计的：

dft = train_data.groupby('AdID').agg({'AdDate': ['nunique', 'unique']})

得到的结果是这样的：

列变成多行了，其实有两个方法可以设置：

第一种，是重新命名列名：

最简单直接的方式：

dft.columns = pd.Series(['Count', 'List'])

结果是这样的：

已经改好了，直截了当，但是呢，如果列数比较多就比较麻烦了，你还要一个个对应。

第二种，在第一种基础上，利用循环将列名根据需要更改，这样不管多少列，都没问题了：

我们先打印下看看列名是什么格式的：

print(dft.columns)

# 结果是这样的：
# MultiIndex(levels=[['AdDate'], ['nunique', 'unique']],
#          codes=[[0, 0], [0, 1]])


print(dft.columns.values)

# 结果是这样的：
# [('AdDate', 'nunique') ('AdDate', 'unique')]

我们看到dft.columns.values其实里面每个列都是一个元组，我们只需要将元组拼接成字符串，然后替换原来的列名就可以了

dft.columns = ['_'.join(col).strip() for col in dft.columns.values]

得到的结果是这样的：

我们再多弄几列看结果：

dft = train_data.groupby('AdID').agg({'AdDate': ['nunique', 'unique', 'first', 'last']})
dft.columns = ['_'.join(col).strip() for col in dft.columns.values]
print(dft)

舒服~

第三种：还有一个方式，是每列单独做，然后拼接，这个其实比较麻烦，这里也记录下，方便使用。而且这个方法还有警告，说是以后会移除掉

dft = train_data.groupby('AdID').AdDate.agg({'Number': 'nunique', 'Values': 'unique'})

得到的结果是这样的：

我把警告也贴出来，就是提示一下。

PS：关于重命名列，其实pandas提供了一个专门的方法：rename，可以这样用：

dft = dft.rename({'AdDate_unique': 'List', 'AdDate_nunique': 'Count'}, axis=1)

但是如果是多层的，不能连接两层去重命名，一般情况的重命名可以使用这个。

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

从63万元“秒没”到订单暴涨655%：具身智能的“春晚效应”与2026破局之路

2048 AI社区

计算机毕业设计Python深度学习物流网络优化与货运路线规划系统大数据毕业设计(源码+文档+PPT+ 讲解)

2048 AI社区

如何理解大模型的参数

2048 AI社区

所有评论(0)

查看更多评论

苏小败在路上

@pz789as

已为社区贡献4条内容