Python pandas.DataFrame调整列顺序及修改index名

1. 从字典创建DataFrame

>>> import pandas
>>> dict_a = {‘user_id‘:[‘webbang‘,‘webbang‘,‘webbang‘],‘book_id‘:[‘3713327‘,‘4074636‘,‘26873486‘],‘rating‘:[‘4‘,‘4‘,‘4‘],‘mark_date‘:[‘2017-03-07‘,‘2017-03-07‘,‘2017-03-07‘]}
>>> df = pandas.DataFrame(dict_a) # 从字典创建DataFrame
>>> df # 创建好的df列名默认按首字母顺序排序,和字典中的先后顺序并不一样,字典中是‘user_id‘,‘book_id‘,‘rating‘,‘mark_date‘
    book_id   mark_date rating  user_id
0   3713327  2017-03-07      4  webbang
1   4074636  2017-03-07      4  webbang
2  26873486  2017-03-07      4  webbang

2. 调整列顺序

>>> df = df[[‘user_id‘,‘book_id‘,‘rating‘,‘mark_date‘]] # 调整列顺序为‘user_id‘,‘book_id‘,‘rating‘,‘mark_date‘
>>> df
   user_id   book_id rating   mark_date
0  webbang   3713327      4  2017-03-07
1  webbang   4074636      4  2017-03-07
2  webbang  26873486      4  2017-03-07

3. 调整index为从1开始

>>> df.index = range(1,len(df) + 1) # 将index改成从1开始
>>> df
   user_id   book_id rating   mark_date
1  webbang   3713327      4  2017-03-07
2  webbang   4074636      4  2017-03-07
3  webbang  26873486      4  2017-03-07

DataFrame操作汇总:http://www.cnblogs.com/huahuayu/p/8227494.html

原文地址:https://www.cnblogs.com/huahuayu/p/8324755.html

时间: 2024-10-12 18:43:34

Python pandas.DataFrame调整列顺序及修改index名的相关文章

DataTable 修改列名 删除列 调整列顺序

DataTable myDt =dt;//删除列myDt.Columns.Remove("minArea");myDt.Columns.Remove("maxArea"); //调整列顺序 ,列排序从0开始myDt.Columns["num"].SetOrdinal(1); //修改列标题名称dt.Columns["num"].ColumnName = "搜索量";dt.Columns["rate

[python][pandas]DataFrame的基本操作

问题来源 在实验中经常需要将数据保存到易于查看的文件当中,由于大部分都是vector数据,所以选择pandas的dataframe来保存到csv文件是最简单的方法. 基本操作 下图是DataFrame的一些基本概念,可以看出与基本的csv结构是保持一致的. 1. 创建DataFrame 创建DataFrame通常有两种方法,从list中创建和从dict中创建: 从dict创建,key的名字会作为名,如下所示: >>> d = {'col1': [1, 2], 'col2': [3, 4]

Python Pandas -- DataFrame

pandas.DataFrame class pandas.DataFrame(data=None, index=None, columns=None, dtype=None, copy=False)[source] Two-dimensional size-mutable, potentially heterogeneous tabular data structure with labeled axes (rows and columns). Arithmetic operations al

python pandas.DataFrame选取、修改数据最好用.loc,.iloc,.ix

先手工生出一个数据框吧 [python] view plain copy import numpy as np import pandas as pd df = pd.DataFrame(np.arange(0,60,2).reshape(10,3),columns=list('abc')) df 是这样子滴 那么这三种选取数据的方式该怎么选择呢? 一.当每列已有column name时,用 df [ 'a' ] 就能选取出一整列数据.如果你知道column names 和index,且两者都很

Python Pandas DataFrame:查询数据or选择数据(selection)之loc,iloc,at,iat,ix的用法和区别

在操作DataFrame时,肯定会经常用到loc,iloc,at等函数,各个函数看起来差不多,但是还是有很多区别的,我们一起来看下吧. 首先,还是列出一个我们用的DataFrame,注意index一列,如下: 接下来,介绍下各个函数的用法: 1.loc函数 愿意看官方文档的,请戳这里,这里一般最权威. loc函数是基于"标签"选择数据的,但是也可以接受一个boolean的array,对于每个用法,我们一一举例: 1.1 单个label 接受一个"标签"(label)

python pandas dataframe 去重函数

今天笔者想对pandas中的行进行去重操作,找了好久,才找打相关的函数 先看一个小例子 <span style="font-size:18px;">from pandas import Series, DataFrame data = DataFrame({'k': [1, 1, 2, 2]}) print data IsDuplicated = data.duplicated() print IsDuplicated print type(IsDuplicated) da

调整DataTable的列顺序

地址:https://www.cnblogs.com/gaocong/p/6490159.html 标题:DataTable 修改列名 删除列 调整列顺序 DataTable myDt =dt; //删除列 myDt.Columns.Remove("minArea"); myDt.Columns.Remove("maxArea"); //调整列顺序 ,列排序从0开始 myDt.Columns["num"].SetOrdinal(1); //修改列

mysql更改表结构:添加、删除、修改字段、调整字段顺序

添加字段: alter table `user_movement_log`Add column GatewayId int not null default 0 AFTER `Regionid` (在哪个字段后面添加) 删除字段: alter table `user_movement_log` drop column Gatewayid 调整字段顺序: ALTER TABLE `user_movement_log` CHANGE `GatewayId` `GatewayId` int not n

[linux][mysql] 命令更改表结构:添加、删除、修改字段、调整字段顺序

原文出处:http://www.phpernote.com/MySQL/1120.html 1 常用的通过mysql命令来更改表结构的一些sql语句,包括添加.删除.修改字段.调整字段顺序. 2 3 添加字段: 4 5 alter table `user_movement_log` Add column GatewayId int not null default 0 AFTER `Regionid`; (在哪个字段后面添加) 6 7 删除字段: 8 9 alter table `user_mo