今天在使用pandas时遇到个问题:df.sum()汇总计算数据和时,把空值当作0进行了计算

如果列数据不全为空,这样计算没啥问题,但如果列数据全为空,计算出的结果就不准确了

由于这几天才接触pandas,一直没找到pandas有没有自带判断列数据是否全空的方法

后来发现可以使用count()方法进行判断,在这儿记录下,给其他刚接触pandas有相同困扰的小伙伴们一点小帮助

a = [['a',   2,  3,  None         ],
     ['b',   2,  3,  np.nan,  None],
     ['c',   2,  3,    4,     np.nan]]

columns=['name','age','class','score','math']

df = pd.DataFrame(a,columns=columns)
print(df)
print('________')

#df.count()会计算这个DataFrame各个列的有效值个数,可以用于判断某列数据是否全空
print(df.count())

print('________')

if df.count()['score'] == 0:
    sumScore = np.nan
else:
    sumScore = df['score'].sum()
print('sumScore:',sumScore)

# math这列数据全空,计算出的结果是nan
if df.count()['math'] == 0:
    sumMath = np.nan
else:
    sumMath = df['math'].sum()
print('sumMath:',sumMath)




#----------运行结果如下----------
#   name  age  class  score  math
# 0    a    2      3    NaN   NaN
# 1    b    2      3    NaN   NaN
# 2    c    2      3    4.0   NaN
# ________
# name     3
# age      3
# class    3
# score    1
# math     0
# dtype: int64
# ________
# sumScore: 4.0
# sumMath: nan

 

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐