pandas操作行集锦

pandas移花接木

数据准备两表:

我们接下来要进行的操作:

  • 将两表进行合并
# 把两张表合并,但是这样有问题,索引会重复的进行0-19
students = page_001.append(page_002)
students

# 我们需要做一步操作,将索引全部重新排列,reset_index同时还要将原索引删除drop=True,这样就OK
students.reset_index(drop=True)

  • 追加一行数据到最后
# 这里必须开启ignore_index告诉pandas直接给我加,不要管索引,否则会报错
append_last = pd.Series({‘ID‘:40, ‘Name‘:‘New_friend‘, ‘Score‘: 90})
# 修改了数据后记住重新把对象引用给students,否则只是修改了副本
students= students.append(append_last,ignore_index=True)

图太长,放结果那几行

  • 追加一行数据到中间的位置,例如索引为20的前面
这里可以先把数据拆分为两部分,一部分为前20,一部分为后面的
part1 = students[:20]
part2 = students[20:]
part1 = part1.append(pd.Series({‘ID‘:100, ‘Name‘: ‘HHHHHH‘, ‘Score‘:1111}),ignore_index=True)
OK合并成功
part1.append(part2,ignore_index=True)

修改数据有两种做法,原理不同结果相同-条条大路通罗马

  • 1.修改其中的一行数据,把38行的Student_39改了
直接修改源数据
students.at[38, ‘Name‘] = ‘HI‘
students

  • 2.DataFrame降维度后得Series对象,我们可以生成Series对象,直接替换掉旧的
# 生成新数据行
new_data = pd.Series({‘ID‘:39 , ‘Name‘: ‘HELLO‘, ‘Score‘: 100})
# 筛选出要替换的行,用iloc或者loc都行,这里我用iloc
students.iloc[39] = new_data
students

drop函数接收一个可迭代对象

删除指定索引的行
students.drop(index=[0,1,2],inplace=True)
students

删除某个范围内的行数据
students.drop(index=range(10,15),inplace=True)
students

将某个区间的Name修改为空值,筛选出这部分数据,并进行删除

for i in range(20, 25):
    students.at[i, ‘Name‘] = ‘‘
students

drop接收一个可迭代对象,那么我们就要先找出空值的数据
missing = students.loc[students[‘Name‘] == ‘‘]
然后将空数据行的索引传给drop
students.drop(index=missing.index,inplace=True)
students

以上就是关于pandas操作行的集锦

原文地址:https://www.cnblogs.com/lishi-jie/p/10155598.html

时间: 2024-11-09 20:17:07

pandas操作行集锦的相关文章

extjs gridpanel 操作行 得到选中行

extjs gridpanel 操作行 得到选中行的列 在Extjs 3.2.0上适合 var model = grid.getSelectionModel(); model.selectAll();//选中所有行 model.selectFirstRow();//选中第一行 model.selectLastRow([flag]);//选中最后一行,flag为正的话保持当前已经选中的行数,不填则默认false model.selectNext();//选中下一行 model.selectPrev

整理pandas操作

本文原创,转载请标识出处: http://www.cnblogs.com/xiaoxuebiye/p/7223774.html 导入数据: pd.read_csv(filename):从CSV文件导入数据 pd.read_table(filename):从限定分隔符的文本文件导入数据 pd.read_excel(filename):从Excel文件导入数据 pd.read_sql(query, connection_object):从SQL表/库导入数据 pd.read_json(json_st

pandas操作Series和DataFrame的基本功能

reindex:重新索引 pandas对象有一个重要的方法reindex,作用:创建一个适应新索引的新对象 以Series为例 1 >>> series_obj = Series([4.5,1.3,5,-5.5],index=('a','b','c','d')) 2 >>> series_obj 3 a 4.5 4 b 1.3 5 c 5.0 6 d -5.5 7 dtype: float64 8 >>> obj2 = series_obj.reind

Python openpyxl、pandas操作Excel方法简介与具体实例

本篇重点讲解windows系统下 Python3.5中第三方excel操作库-openpyxl: 其实Python第三方库有很多可以操作Excel,如:xlrd,xlwt,xlwings甚至注明的数据分析模块Pandas也提供pandas.read_excel.pandas.DataFrame.to_excel功能. 那么openpyxl的库有哪些优缺点呢: 优势: 1.openpyxl提供对pandas的dataframe对象完美支持: 2.openpyxl支持后台静默打开excel文件: 3

pandas操作速查表

准备工作 import numpy as np import pandas as pd 倒入文件或创建一个数据表 df = pd.DataFrame(pd.read_csv('name.csv',header=1)) df = pd.DataFrame(pd.read_excel('name.xlsx')) pd.read_table(filename)# 从限定分隔符的文本文件导入数据 pd.read_excel(filename)# 从Excel文件导入数据 pd.read_sql(quer

Pandas操作excel

读取excel:Pandas库read_excel()参数详解 pandas.read_excel(io,sheet_name = 0,header = 0,names = None,index_col = None,usecols = None,squeeze = False,dtype = None, ...) io:字符串,文件的路径对象. sheet_name:None.string.int.字符串列表或整数列表,默认为0.字符串用于工作表名称,整数用于零索引工作表位置,字符串列表或整数

pandas操作mysql从放弃到入门

目录 相关帮助文档 一.如何读取数据库-read_sql 二.如何筛选数据 三.如何连表-merge 四.如何删除一行或一列-drop 五.如何分组统计-groupyby 六.如何排序-sort_values/sort_index 七.如何重建索引-groupby(as_index=False)/reset_index 八.如何翻转dataframe-T 九.如何重命名列-rename 十.如何强制转换类型-astype 十一.groupby只有一列时如何count-size 十二.如何操作时间

Pandas 操作

一.Series的创建: pd.Series([ 数据 ]) In [17]: import pandas as pd In [18]: import numpy as np In [19]: s = pd.Series([1,1,1,1,np.nan]) In [20]: s Out[20]: 0 1.0 1 1.0 2 1.0 3 1.0 4 NaN dtype: float64 二.生成DataFrame 1,Numpy 产生随机数组 In [17]: np.random.rand(5,5

MySql操作语句集锦

Windows服务 -- 启动MySQL    net start mysql-- 创建Windows服务    sc create mysql binPath= mysqld_bin_path(注意:等号与值之间有空格) 连接与断开服务器 mysql -h 地址 -P 端口 -u 用户名 -p 密码 SHOW PROCESSLIST -- 显示哪些线程正在运行SHOW VARIABLES -- 显示系统变量信息 数据库操作 -- 查看当前数据库    SELECT DATABASE();--