pandas 读取csv 按行读取

import pandas as pdcsvfile = open('text.csv',encoding='utf-8')df = pd.read_csv(csvfile,engine='python')# 按行读取保存到字典里，假设每行有三个字段，item_id,info,titledict_item_id = {}dict_info = {}dict_title = {}di...

顶晚人

31319人浏览 · 2019-07-18 11:05:12

顶晚人 · 2019-07-18 11:05:12 发布

import pandas as pd
csvfile = open('text.csv',encoding='utf-8')
df = pd.read_csv(csvfile,engine='python')
# 按行读取保存到字典里，假设每行有三个字段，item_id,info,title
dict_item_id = {}
dict_info = {}
dict_title = {}
dict_item_id_reverse = {}
for i in range(len(df)):
    dict_item_id[i] = df["item_id"][i]
    dict_info[i] = df["info"][i]
    dict_title[i] = df["title"][i]
    dict_item_id_reverse[df["item_id"][i]] = i

通过字典的key i 构建了item_id,info,title字段的关联,方便后续数据的处理。

目的是分别提取出每行每个字段下面的数据。

1、pandas.read_csv()函数，读取文件数据时，由于分隔符为'::'，弹出如下警告

警告：ParserWarning: Falling back to the 'python' engine because the 'c' engine does not support regex separators (separators > 1 char and different from '\s+' are interpreted as regex)

解决方法：增加函数的引擎参数engine='python'，如下：

header = ['user_id', 'item_id', 'rating', 'timestamp']
df = pd.read_csv("D:/ratings.dat", sep='::', names=header,engine='python')

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

AIGC自动化编程实战（Python、Java、JavaScript和VBA） -2.9G课程

2048 AI社区

Flutter Riverpod + MVI 状态管理实现的提示词优化器

2048 AI社区

【教女友用 AI 系列】所谓的网感根本不是玄学，而是一套腹黑算法。

2048 AI社区

所有评论(0)

查看更多评论

顶晚人

@qq_34333481

已为社区贡献6条内容