一、pandas基本数据类型

二、DataFrame和Series创建与访问

pd.DataFrame(data,index,columns,dtype):创建一个DataFrame。

pd.Series(data,index,dtype):创建一个Series。

df.head(n):查看DataFrame前n行,默认为前5行。

df.tail(n):查看DataFrame后n行,默认为后5行。

df.index:获取DataFrame的索引。

df.columns:获取DgtgFrgme的列名

三、数据选择

df.loc[rows,cols]:基于行和列的标签选择数据。

df.iloc[indexer,columns]:基于行和列的整数位置选择数据。

df.loc[row,col]:选择特定的行和列。

df.iloc[index]:选择特定的位置。

四、.数据清洗

df.drop(labels, axis, index, columns):删除 DataFrame 中 的行或列。

df.fillna(value):用特定的值填充DataFrame中的空值。

df.dropna():删除含有空值的行或列。

五、数据合并

pd.concat(objs,axis,join,ignore_index,keys,levels, names):沿既定的轴将多个DataFrame连接起来。

df.append(rows, ignore_index):在 DataFrame 中追加行。

df.join(other, on, how, lsuffix, rsuffix, sort):根据共同的列 或索引将两个DataFrame合并

六、数据分组与汇总

df.groupby(column):根据某列的值对 DataFrame 进行分 组。

df.aggregate(func):对分组后的数据应用聚合函数。

df.pivot(index,columns,values):创建一个数据透视表

七、时间序列

pd.to_datetime(arg, errors,format,utc):将字符串转换为 datetime对象。

df.resample(rule, how, axis, closed, label, convention kind):对时间序列数据进行重采样。

八、数据统计

df.describe(:生成DataFrame的描述性统计摘要。

df.mean():计算DataFrame的均值。

df.medianO:计算DataFrame的中位数。

df.std():计算DataFrame的标准差。

九、数据排序

df.sort_index(axis, ascending, inplace): 根 据DataFrame的索引对数据进行排序。

df.sort_values(by,axis, ascending,inplace,kind):根据某 列或多列的值对 DataFrame 进行排序。

十、数据导入与导出

pd.read_csv(filepath,sep,delimiter):从 csV文件中读取 数据。

pd.read_excel(filepath, sheet_name, header): 从 Excel 文 件中读取数据。

df.to_csv(path, sep, index):将 DataFrame 导出到 csV 文 件。

df.to_excel(path, sheet_name, index):将 DataFrame 导出 到Excel文件。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐