Python数据分析实战：缺失值处理小萝卜头资料简介_经营_新闻资讯_资讯

写在前面

上周我们读取完了数据（Python数据分析实战：获取数据），下面就要对数据进行清洗了，首先是对缺失值的处理。缺失值也就是空值，先找出来再处理。

查看缺失值

可以使用isnull方法来查看空值，得到的结果是布尔值。

#查看缺失值 df_list.isnull()

结果：

对于小的数据集来说，可以这样看，但对于大的数据集这样查看空值貌似没什么意义，没关系，还有其他方法，可以使用info方法

#查看空值 df_list.info()

结果：

info方法可以看到字段的数据类型以及每个字段下有多少个非空值，可以看到nei**ourhood_group 字段全为空，这和布尔值显示的结果一致。

其实还有一个方法，更简单了：

#查看空值 df_list.isnull().sum()

对取出来的isnull的布尔值求和，就很明显地看到，id列是没有空值的，name列有一个空值，结果：

也可以对单独的某一列这样查看空值，对name列查看空值

#对单独一列查看空值 df_list["name"].isnull().sum()

结果为1，说明name列有1个空值：

缺失值的处理

找到缺失值以后如何处理呢？删除或填充。

删除缺失值

用dropna方法，默认是只要一行中有一个缺失值这一行就全都删除

#删除缺失值 df_list.dropna()

结果就是这个数据集里的数据全被删掉了，因为其中的nei**ourhood_group这个字段全为空，按照dropna的尿性，有一个为空就整行删除，就得到了如下结果：

当然也可以给这个方法传入how="all"参数，只有在整行为空的前提下才删除。

#整行都为空才删除 df_list.dropna(how="all")

结果是一条都没有删除，因为这个数据集里没有所有字段都为空的记录：

但是有一列数据都为空的字段，把nei**ourhood_group这一列删掉，还记得删除列的方法吗

#删除列 df_list=df_list.drop(columns="nei**ourhood_group") df_list

结果：

name列也是有一个空值的，找出来看一下

#定位到name列的空值 df_list[df_list["name"].isnull()]

结果如下，这一行还是删了吧。

删除行用drop方法，刚刚定位出了要删除的那一行，行索引是456

#删除name列的空值的行 df_list=df_list.drop(index=456) df_list

结果可以看到变成了28451行，之前一直都是28452行。

缺失值填充

当然缺失值除了删除外，还可以进行填充，可以用0填充，也可以用均值、众数填充。用fillna方法进行缺失值的填充。

last_review和reviews_per_month这两列也有缺失值，我们用众数填充（mode）last_review列的缺失值，用均值（mean）填充reviews_per_month列的缺失值。

#缺失值填充 df_list.fillna({"last_review":df_list.last_review.mode(), "reviews_per_month":df_list.reviews_per_month.mean()})

结果

这里只是举例缺失值也可以被填充这样处理，在这个案例里，不建议这两列填充，空着就空着吧。下节内容来处理重复值和异常值。

猜你喜欢：
Python数据分析实战：获取数据

《吊打分析师》实战—我要租个好房

为什么要学统计学：**的统计学

成为数据分析师的第三年，我写了10W字

简单的Excel数据分析案例

@ 作者：可乐
@ 公众号/知乎专栏/头条/简书：可乐的数据分析之路
@ 加微信（data_cola）备注：进群，拉你进可乐的数据分析交流群，数据分析知识总结，不定期行业经验分享

原文链接：http://www.wanshiruyi.cc/news/19864.html，转载和复制请保留此链接。
以上就是关于Python数据分析实战：缺失值处理小萝卜头资料简介全部的内容，关注我们，带您了解更多相关内容。

阅读剩余 71%

特别提示：本信息由相关用户自行提供，真实性未证实，仅供参考。请谨慎采用，风险自负。

车载 HMI | 负一屏设计必备知识点有人骂你野心勃勃是什么歌

Halo，这里是设计夹，今天分享的是「HMI设计」。或许你还在观望HMI设计师这一行业方向，其实HMI设计师是一门对于车机系统的交互框架-层级与布局-克制的视觉的研究。新能源汽车发展迅速，车载的中控的

2025-04-06

东方甄选，非要用直播回应负面舆情人字加一笔是什么字

来源| 在公关之前一直没写东方甄选的话题，被后台各种留言催更，还有人说我太懒了，这么大的事儿都不写。Emmm……看来倒是都相信稿子确实是我写的。其实，我一开始是觉得在公关角

2025-04-06

理解业务对数据分析有多重要？李咏简历

编辑导读：数据分析是指过分析数据，发现业务问题，洞察商业机会点，为业务增长提供合理建议及参考依据，并输出数据报告。而现实当中，很多业务场景都可由数据体现出来。本文将从四个方面，论述业务对数据分析的重要

2025-04-06

蜜雪冰城“魔性”主题曲狂揽900万播放量，品牌玩梗太野了乱世佳人简介

最近，小编在B站的推荐页不断刷出了不同改编版本的「蜜雪冰城主题曲」。一开始我还以为是系统大数据嗅到了我的贫穷，特地给我推荐蜜雪冰城……但是几乎每一个改编版本的播放量都不低，甚至还出现了不同语言和方言的

2025-04-06

鸿星尔克为什么不该打“慈善”标签？黄小柔 junior 分手

这期我特别想说说鸿星尔克这家公司，对于这家公司最近一年就坡下驴贴标签的“玩法”，我有些自己的观点和你分享。如果你们公司也在思考品牌关键词和标签，希望对你有启发。背景信息：202

2025-04-06

Python数据分析实战：缺失值处理小萝卜头资料简介

相关推荐

车载 HMI | 负一屏设计必备知识点有人骂你野心勃勃是什么歌

东方甄选，非要用直播回应负面舆情人字加一笔是什么字

理解业务对数据分析有多重要？李咏简历

蜜雪冰城“魔性”主题曲狂揽900万播放量，品牌玩梗太野了乱世佳人简介

鸿星尔克为什么不该打“慈善”标签？黄小柔 junior 分手

分享到：