pandas删除缺失数据(pd.dropna()方法)

1.创建带有缺失值的数据库:

import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.randn(5, 3), index = list(‘abcde‘), columns = [‘one‘, ‘two‘, ‘three‘])        # 随机产生5行3列的数据
df.ix[1, :-1] = np.nan        # 将指定数据定义为缺失
df.ix[1:-1, 2] = np.nan

print(‘\ndf1‘)        # 输出df1,然后换行
print(df)        

查看数据内容:

2.通常情况下删除行,使用参数axis = 0,删除列的参数axis = 1,通常不会这么做,那样会删除一个变量。

print(‘\ndrop row‘)
print(df.dropna(axis = 0))

删除后结果:

原文地址:https://www.cnblogs.com/zknublx/p/9720321.html

时间: 2024-11-02 07:17:42

pandas删除缺失数据(pd.dropna()方法)的相关文章

MySQL中删除重复数据的简单方法,mysql删除重复数据

MYSQL里有五百万数据,但大多是重复的,真实的就180万,于是想怎样把这些重复的数据搞出来,在网上找了一圈,好多是用NOT IN这样的代码,这样效率很低,自己琢磨组合了一下,找到一个高效的处理方式,用这个方式,五百万数据,十来分钟就全部去除重复了,请各位参考. 第一步:从500万数据表data_content_152里提取出不重复的字段SFZHM对应的ID字段到TMP3表 create table tmp3 as select min(id) as col1 from data_content

EF删除所有数据行的方法.所以下面给大家介绍几种方法.

使用ExecuteStoreCommand方法,代码如下. using (var db = new msdbEntities()) { db.ExecuteStoreCommand("DELETE " + db.students.EntitySet.ElementType.Name); } 使用 Entity FrameWork  删除数据,着实是一件比较头疼的数据,若是少量数据,可以使用以下方法删除 var delete=db.NikeDTCDailyReport.Where(u =

win8从回收站删除的数据寻回方法

问题描述:从回收站删除是非常常见的文件丢失现象.从回收站删除后需要注意的是要恢复的盘(文件原来在的那个盘)不能存入新的文件,尽快用将丢失的文件恢复出来.下面简单介绍一种快速且安全恢复的方法.工具/软件:极限数据恢复软件 步骤1:先百度搜索并下载程序打开后,在软件中,选择需要恢复的盘,软件就会这个盘扫描.步骤2:等待程序扫描完成,大概需要几分钟时间.步骤3:程序会很快将扫描到的数据,都在<$RECYCLE.BIL>或<$RECYCLE>中($RECYCLE这个文件是回收站在里面的真正

吴裕雄--天生自然 R语言开发学习:处理缺失数据的高级方法(续一)

#-----------------------------------# # R in Action (2nd ed): Chapter 18 # # Advanced methods for missing data # # requires packages VIM, mice # # install.packages(c("VIM", mice)) # #-----------------------------------# par(ask=TRUE) # load the

Pandas之Dropna滤除缺失数据

import pandas as pd import numpy as np from numpy import nan as NaN 一.处理Series对象 通过dropna()滤除缺失数据 from numpy import nan as NaN se1=pd.Series([4,NaN,8,NaN,5]) print(se1) se1.dropna() 结果如下: 0 4.0 1 NaN 2 8.0 3 NaN 4 5.0 dtype: float64 0 4.0 1 NaN 2 8.0

Pandas 10分钟入门----缺失数据的处理(官方文档注释版三)

在日常我们获取的数据中,经常会出现数据缺失的情况.对数据缺失的处理,有多种处理的方法:插值填补.平均值填补方法很多.这里不具体讨论用哪种方式去插补这些数据,而只是谈谈如何使用pandas去快速的处理这些数据. pandas 常用np.nan代表缺失数据,详情可以查看Missing Data section. 1. reindex()可以允许你在指定维度上修改.增加.删除索引,并返回数据的副本: df1 = df.reindex(index=dates[0:4], columns=list(df.

python pandas 获取列数据的几种方法及书写形式比较

pandas获取列数据位常用功能,但在写法上还有些要注意的地方,在这里总结一下: ''' author: zilu.tang 2015-12-31 ''' import pandas as pd data1 = pd.DataFrame(...) #任意初始化一个列数为3的DataFrame data1.columns=['a', 'b', 'c'] 1. data1['b'] #这里取到第2列(即b列)的值 2. data1.b #效果同1,取第2列(即b列) #这里b为列名称,但必须是连续字

pandas中pd.read_excel()方法中的converters参数

最近用pandas的pd.read_excel()方法读取excel文件时,遇到某一列的数据前面包含0(如010101)的时候,pd.read_excel()方法返回的DataFrame会将这一列视为int类型,即010101变成10101. 这种情况下,如果想要保持数据的完整性,可以以str类型来读取这一列,具体的实现如下: 1 df = pd.read_excel ("test.xlsx" , converters={'类别编码':str}) 如上代码,即可将"test.

mysql 清空或删除表数据后,控制表自增列值的方法

http://blog.sina.com.cn/s/blog_68431a3b0100y04v.html 方法1: truncate table 你的表名 //这样不但将数据全部删除,而且重新定位自增的字段 方法2: delete from 你的表名 dbcc checkident(你的表名,reseed,0) //重新定位自增的字段,让它从1开始 方法3: 如果你要保存你的数据,介绍你第三种方法,by QINYI 用phpmyadmin导出数据库,你在里面会有发现哦 编辑sql文件,将其中的自