pandas缺失值补充
1、创建带有缺失值的数据框
#coding:utf8
import pandas as pd
import numpy as np
df=pd.DataFrame(np.random.randn(5,3),index=list(‘abcde‘),columns=[‘one‘,‘two‘,‘tree‘])
df.1x[1,:-1]=np.nan
df.1x[1:-1,2]=np.nan
print ‘\ndf1‘
print df
2、使用0替换缺失值
print ‘\zero‘
print df.fillna(0)
3、使用字符串替换缺失值
print ‘\nmissing‘
print df.fillna(‘missing‘)
4、用上一个数据来替代
print ‘\npad‘
print df.fillna(method=‘pad‘)
5、用后一个数据来替代,用limit限制每一列可以替换的数量
print ‘\nbfill‘
print df.fillna(method=‘bfill‘,limit=1)
6、用平均数来替换
print ‘\nmean‘
print df.fillna(df.mean())
6、选择某列用平均数来替换
print ‘\nlimit mean‘
print df.fillna(df.mean() [‘one‘:‘two‘])
时间: 2024-10-29 19:11:09