作用

解决两个表或者多个表按照纵向或者横向拼接。

使用方法

pd.concat( [df数据1, df数据2, …… ], axis = 0或1, join = 连接方式, keys = 表明数据来源 )

pd.concat() 参数的探索

axis 参数

axis = 0 (默认) -->   表示纵向拼接多个表, 记忆方法:0 代表长长的圈,把数据的列给圈起来了。
axis = 1  -->  表示横向拼接多个表,常用于多个字段或特征的拼接

join = 参数设置 join()函数

join=outer ,表示保留所有的列,并将不存在的值设为缺失
join=inner ,表示保留两个表都出现过的列。

keys 参数 :

为了明确哪些数据来源于哪个变量,则我们使用

keys = ["来源地点1","来源地点2", ……]

代码实战:

import pandas as pd

df1 = pd.DataFrame({'Name':['San Zhang','Si Li'], 'Age':[20,21]})
df2 = pd.DataFrame({'Name':['Wu Wang'],'Age':[21]})
df_concat = pd.concat([df1, df2], keys=['one', 'two'])

print(df_concat)

运行结果:

            Name  Age
one 0  San Zhang   20
    1      Si Li   21
two 0    Wu Wang   21
Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐