本文共 651 字,大约阅读时间需要 2 分钟。
将dataframe中的NAN值进行填充,填充方法如下:
用0填充:
df.fillna(0)
用字符串填充:
df.fillna("missing")
用前一个数据填充:
df.fillna(method="pad")
用后一个数据代替NaN:
df.fillna(method="bfill")
这里的前、后一个数值默认是纵向看的,如果需要使用左或者右边的数值进行填充,只需要加参数axis=1,就可以了。
limit参数限制每列可以替代NaN的数目,例如限制每列只能替代一个NaN
df.fillna(method="bfill",limit=1)
使用平均数填充:
df.fillna(df.mean())
对指定列填充:
df.fillna(df.mean()["one":"two"])
参考:
用某列的均值填充该列NAN值:
for column in list(feature_1.columns[feature_1.isnull().sum() > 0]): mean_val = feature_1[column].mean() feature_1[column].fillna(mean_val, inplace=True)
加 inplace=True,才会在原df上进行数据修改。
按照axis指定方向,用差值替代,差值是前后或者上下的中间值
store_items.interpolate(method = 'linear', axis = 0)
其他有用连接:
转载地址:http://nhhgi.baihongyu.com/