Numpy 对战 Pandas 之CSV文件读取效率

Numpy 对战 Pandas 之CSV文件读取效率1. Numpy.loadtxt()2. Pandas.read_csv()3. 总结4. 意外发现本文旨在分析Numpy读取CSV文件和Pandas读取CSV文件的对比。1. Numpy.loadtxt()官网教程-Numpy.loadtxt()使用numpy中的loadtxt()方法可以很方便的读取文件，代码如下：import t...

不堪沉沦

2766人浏览 · 2020-04-10 14:33:01

不堪沉沦 · 2020-04-10 14:33:01 发布

Numpy 对战 Pandas 之CSV文件读取效率

1. Numpy.loadtxt()
2. Pandas.read_csv()
3. 总结
4. 意外发现

本文旨在分析Numpy读取CSV文件和Pandas读取CSV文件的对比。
在这里插入图片描述

1. Numpy.loadtxt()

官网教程-Numpy.loadtxt()
使用numpy中的loadtxt()方法可以很方便的读取文件，代码如下：

import time
import numpy as np
path = r"C:\Users\hewenyong\Desktop\csv\csv_folder\2.csv"

start = time.clock()  # 起始时间
dataset = np.loadtxt(path, dtype=np.str, delimiter=',') # 读取文件
test_dict = {}
data = dataset.tolist()
for item in data:
    print(item)
end = time.clock()  # 结束时间

print(str(end-start))

结果如下：
红色框起来的为整个读取csv文件的的时间，大约0.106秒，（上面还有一大堆打印的结果就没粘贴出来）
Numpy.loadtxt()读取文件时间结果图

2. Pandas.read_csv()

官网教程-Pandas.read_csv()
这是pandas.read_csv()方法的基本使用过程，代码如下：

import time
path = r"C:\Users\hewenyong\Desktop\csv\csv_folder\2.csv"

start = time.clock()
with open(path, 'r', encoding='UTF-8') as f:
    dataset = pd.read_csv(f, header=None)
for index,row in dataset.iterrows():
    print(row[0],row[1])

end = time.clock()

print(str(end-start))

结果如下：
可以看到耗时大约0.386s
在这里插入图片描述

3. 总结

结论：
从上面结果图可以看到我们考虑从csv文件的读取，到遍历每一行数据完成。
numpy.load_txt()更胜一筹。

4. 意外发现

由于print函数等中间操作存在效率影响，所以将中间操作代码直接注释，只考虑文件读取过程，发现，结果恰恰相反，pandas.read_csv()时间更短。
结果如下表格：

	numpy.load_txt()	pandas.read_csv()
打按行印所有数据	0.106秒	0.386s
只考虑文件读取	0.0107秒	0.0029s

因此，具体使用没有绝对，还是看场景。

论直接读取csv，pandas可能更快；
但是当我们需要遍历每一行数据，则numpy更快。

开心，又Get到编程的快乐。
加油！

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

供应链优化卡脖子？AI应用架构师教你用这5套技术方案破局（附代码框架）

想象一下：某手机厂商因预测错误，多生产100万部滞销机型，导致10亿元库存积压；同时另一款热销机型因零部件断供，错失20亿元市场机会——这不是虚构案例，而是2023年某头部企业的真实经历。供应链就像企业的"血液循环系统"，一旦堵塞，整个机体都会陷入危机。本文的核心目的是：用AI技术方案解决供应链5大"卡脖子"难题——需求预测不准、库存管理混乱、物流效率低下、供应商选择盲目、风险应对滞后，帮助企业实

2048 AI社区

SpringAI-Advisor

2048 AI社区

未来机器人控制哲学与美学设想

摘要：本文提出了一种基于热力学熵减原理的分布式机器人控制架构——“熵减的具身”，通过物理隔离高熵躯体（ESP32）与负熵大脑（PC/Server），重构学习本质：预测动作与感知的交互影响。躯体仅传递原始数据，大脑通过动态向量模型（DynamicCellVocab/BrainAR）压缩熵流，以最小化预测误差（变分自由能）驱动主动推断。系统模仿婴儿发育，从随机动作中建立本体感知，逐步形成因果世界模型