python缺失值填充方法示例代码

1.找到缺失值

导入数据集

df=pd.read_csv("nba.csv")
df.head(10)

替换异常值（数据集中异常值为“-”）

把数据集中的异常值用“NaN”替换

# 将空值形式的缺失值转换成可识别的类型
data = data.replace('-', np.NaN)

2.计算缺失值的数量

用#>

null_all = df.isnull().sum()
print(null_all)

.sum();表示可以显示各个列的缺失值数量。

null_all = df.isnull.any(axis=1)#表示那些行具有缺失值，

.any()表示只要按行或列计算，有缺失值就算入
.all()表示所在行或列全为缺失值才计入
.sum()表示计算列缺失值时，一列有多个缺失值，同理，计算行缺失，计算有多少个行。

3.处理缺失值

3.1:df.dropna():直接删除行列

df表示数据集的名称

dropna(axis=0,>
括号内上述参数都是函数默认。

axis=0:表示对行进行删除操作，axis=1:对列删除进行操作
how=‘any’：表示维度存在“缺失值”就删除相应行/列操作；how=‘all’：进行相关行或列删除操作时，只有所有维度缺失才删除。
thresh=None：等于几表示有几个缺失值存在才会删除所在的行或列。
inplace=False：表示对原来的数据集不进行操作，True时表示对原来的数据集也进行操作。

3.2:df.fillna()填充缺失值

fillna(value=None,>
axis : {0 or ‘index’, 1 or ‘columns’}

method : {‘backfill’, ‘bfill’, ‘pad’, ‘ffill’, None}
pad’, ‘ffill：将前面的值填充于后面位置。
backfill’, 'bfill：表示将后面的值填充于前面位置。

data.fillna(data.mean())#平均值填充 data.fillna(data.median())#中位数填充

3.3:KNN填充

from sklearn.impute import KNNImputer imputer = KNNImputer(n_neighbors=4)#邻居样本求平均数 df1=imputer.fit_transform(df)

4.查看数据集的末尾

df.tail(10)

查看末尾10行

总结

到此这篇关于python缺失值填充方法的文章就介绍到这了,更多相关python缺失值填充方法内容请搜索易采站长站以前的文章或继续浏览下面的相关文章希望大家以后多多支持易采站长站！

python缺失值填充方法示例代码

目录

1.找到缺失值

2.计算缺失值的数量

3.处理缺失值

3.1:df.dropna():直接删除行列

3.2:df.fillna()填充缺失值

3.3:KNN填充

4.查看数据集的末尾

总结

Python ArcPy实现批量拼接长时间序列栅格图像

Python 中OS module的使用详解

Python Matplotlib基本用法详解

Python range() 函数用法详解

Python分割单词和转换命名法的实现

Python 中OS module的使用详解

使用Pytorch构建第一个神经网络模型附案例实战

Python实现关键路径和七格图计算详解

python3中SQLMap安装教程

kali最新国内更新源sources

Python ArcPy实现批量拼接长时间序列栅格图像

Python 中OS module的使用详解

Python Matplotlib基本用法详解

Python range() 函数用法详解

Python分割单词和转换命名法的实现

Python 中OS module的使用详解

使用Pytorch构建第一个神经网络模型附案例实战

Python实现关键路径和七格图计算详解

python3中SQLMap安装教程

kali最新国内更新源sources

python缺失值填充方法示例代码

目录

1.找到缺失值

2.计算缺失值的数量

3.处理缺失值

3.1:df.dropna():直接删除行列

3.2:df.fillna()填充缺失值

3.3:KNN填充

4.查看数据集的末尾

总结

Python ArcPy实现批量拼接长时间序列栅格图像

Python 中OS module的使用详解

Python Matplotlib基本用法详解

Python range() 函数用法详解

Python分割单词和转换命名法的实现

Python 中OS module的使用详解

使用Pytorch构建第一个神经网络模型 附案例实战

Python实现关键路径和七格图计算详解

python3中SQLMap安装教程

kali最新国内更新源sources

Python ArcPy实现批量拼接长时间序列栅格图像

Python 中OS module的使用详解

Python Matplotlib基本用法详解

Python range() 函数用法详解

Python分割单词和转换命名法的实现

Python 中OS module的使用详解

使用Pytorch构建第一个神经网络模型 附案例实战

Python实现关键路径和七格图计算详解

python3中SQLMap安装教程

kali最新国内更新源sources

使用Pytorch构建第一个神经网络模型附案例实战

使用Pytorch构建第一个神经网络模型附案例实战