Pandas知识点总结
pd.DataFrame(data,index,columns,dtype):创建一个DataFrame。pd.Series(data,index,dtype):创建一个Series。df.head(n):查看DataFrame前n行,默认为前5行。df.tail(n):查看DataFrame后n行,默认为后5行。df.index:获取DataFrame的索引。df.columns:获取DgtgF
一、pandas基本数据类型

二、DataFrame和Series创建与访问
pd.DataFrame(data,index,columns,dtype):创建一个DataFrame。
pd.Series(data,index,dtype):创建一个Series。

df.head(n):查看DataFrame前n行,默认为前5行。

df.tail(n):查看DataFrame后n行,默认为后5行。
df.index:获取DataFrame的索引。
df.columns:获取DgtgFrgme的列名

三、数据选择
df.loc[rows,cols]:基于行和列的标签选择数据。
df.iloc[indexer,columns]:基于行和列的整数位置选择数据。
df.loc[row,col]:选择特定的行和列。
df.iloc[index]:选择特定的位置。

四、.数据清洗
df.drop(labels, axis, index, columns):删除 DataFrame 中 的行或列。
df.fillna(value):用特定的值填充DataFrame中的空值。
df.dropna():删除含有空值的行或列。
五、数据合并
pd.concat(objs,axis,join,ignore_index,keys,levels, names):沿既定的轴将多个DataFrame连接起来。
df.append(rows, ignore_index):在 DataFrame 中追加行。
df.join(other, on, how, lsuffix, rsuffix, sort):根据共同的列 或索引将两个DataFrame合并
六、数据分组与汇总
df.groupby(column):根据某列的值对 DataFrame 进行分 组。
df.aggregate(func):对分组后的数据应用聚合函数。
df.pivot(index,columns,values):创建一个数据透视表
七、时间序列
pd.to_datetime(arg, errors,format,utc):将字符串转换为 datetime对象。
df.resample(rule, how, axis, closed, label, convention kind):对时间序列数据进行重采样。
八、数据统计
df.describe(:生成DataFrame的描述性统计摘要。
df.mean():计算DataFrame的均值。
df.medianO:计算DataFrame的中位数。
df.std():计算DataFrame的标准差。
九、数据排序
df.sort_index(axis, ascending, inplace): 根 据DataFrame的索引对数据进行排序。

df.sort_values(by,axis, ascending,inplace,kind):根据某 列或多列的值对 DataFrame 进行排序。
十、数据导入与导出
pd.read_csv(filepath,sep,delimiter):从 csV文件中读取 数据。
pd.read_excel(filepath, sheet_name, header): 从 Excel 文 件中读取数据。
df.to_csv(path, sep, index):将 DataFrame 导出到 csV 文 件。
df.to_excel(path, sheet_name, index):将 DataFrame 导出 到Excel文件。

更多推荐



所有评论(0)