pandas.DataFrame 索引方法区别

有三种索引：ix，iloc，loc；

使用方法都是 __.ix[row, columns]

详细的见 pandas 文档。

需要注意的差别是：

　　1，ix方法混合索引和位置下标（必须是整数），先考虑是否是在标签索引中，然后考虑是位置下标。如果是整数作为index，ix就按照索引标签选取。

　　　 loc方法按照标签，iloc方法按位置下标。

　　2，虽然都支持切片，单个选择也超出范围；

　　　　但是，单个赋值的时候，ix方法可以选择不再索引内的，类似字典的方式新建一个标签行或列。

一般情况最好明确使用标签还是位置，即使用loc、iloc。

一方面是意思明确，另一方面是ix选取的时候会复制对象，这会影响效率，如果是赋值给了另外的变量，那么新变量的操作不影响到原来的数据。

　　使用loc,iloc选择的结果是一个视图，赋值给别的变量后，变量的改动会互相影响。

而创建新的变量最好显式使用copy方法。

时间： 2024-10-12 14:59:49

pandas.DataFrame 索引方法区别的相关文章

pandas.DataFrame的groupby()方法的基本使用

pandas.DataFrame的groupby()方法是一个特别常用和有用的方法.让我们快速掌握groupby()方法的基础使用,从此数据分析又多一法宝. 首先导入package: import pandas as pd import numpy as np groupby的最基本操作 df = pd.DataFrame({'A':[1,2,3,1],'B':[2,3,3,6],'C':[3,1,5,7]}) df 按照A列来进行分组(其实说白了就是将A列中重复的值和成同一个值,然后把A当成索

str类型特有和公共方法以及切片和索引的区别

字符串的创建方式 1. s = "Lebron James" 2. s = str("Lebron James") #调用str对象进行创建相当于str.__init__( "Lebron James") 字符串的一些方法 a.特有方法 s.strip() s.find() s.startwith() s.endwith() s.replace() s.upper() s.lower() s.isalpha s.is....()

pandas.DataFrame学习系列2——函数方法(1)

DataFrame类具有很多方法,下面做用法的介绍和举例. pandas.DataFrame学习系列2--函数方法(1) 1.abs(),返回DataFrame每个数值的绝对值,前提是所有元素均为数值型 1 import pandas as pd 2 import numpy as np 3 4 df=pd.read_excel('南京银行.xlsx',index_col='Date') 5 df1=df[:5] 6 df1.iat[0,1]=-df1.iat[0,1] 7 df1 8 Open

pandas DataFrame(2)-行列索引及值的获取

pandas DataFrame是二维的,所以,它既有列索引,又有行索引上一篇里只介绍了列索引: import pandas as pd df = pd.DataFrame({'A': [0, 1, 2], 'B': [3, 4, 5]}) print df # 结果: A B 0 0 3 1 1 4 2 2 5 行索引自动生成了 0,1,2 如果要自己指定行索引和列索引,可以使用 index 和 column 参数: 这个数据是5个车站10天内的客流数据: ridership_df = pd

pandas.DataFrame学习系列1——定义及属性

定义: DataFrame是二维的.大小可变的.成分混合的.具有标签化坐标轴(行和列)的表数据结构.基于行和列标签进行计算.可以被看作是为序列对象(Series)提供的类似字典的一个容器,是pandas中主要的数据结构. 形式: class pandas.DataFrame(data=None, index=None, columns=None, dtype=None, copy=False) 参数含义: data : numpy ndarray(多维数组)(结构化或同质化的), dict(字典

pandas DataFrame和Series

Pandas入门-Series和DataFrame 概述:pandas含有使数据分析工作变得更快更简单的高级数据结构和操作工具,pandas是基于Numpy构建的.pandas在过去的几年中逐渐成长为一个非常强大的库. pandas的数据结构介绍引入pandas >>> from pandas import Series,DataFrame >>> import pandas as pd pandas有两个主要的数据结构:Series和DataFrame. Serie

pandas DataFrame(1)

之前介绍了numpy的二维数组,但是numpy二维数组有一些局限性,比如,它数组里所有的值的类型必须相同,不能某一列是数值型,某一列是字符串型,这样会导致无法使用 mean() , std() 等方法去计算某一行或某一列. 但是,使用pandas DataFrame可以解决这一问题. pandas DataFrame也是二维数据,和pandas Series一样, pandas DataFrame也有'索引'这个概念,它每一列都有一个索引值: import pandas as pd df = p

Python openpyxl、pandas操作Excel方法简介与具体实例

本篇重点讲解windows系统下 Python3.5中第三方excel操作库-openpyxl: 其实Python第三方库有很多可以操作Excel,如:xlrd,xlwt,xlwings甚至注明的数据分析模块Pandas也提供pandas.read_excel.pandas.DataFrame.to_excel功能. 那么openpyxl的库有哪些优缺点呢: 优势: 1.openpyxl提供对pandas的dataframe对象完美支持: 2.openpyxl支持后台静默打开excel文件: 3

[python][pandas]DataFrame的基本操作

问题来源在实验中经常需要将数据保存到易于查看的文件当中,由于大部分都是vector数据,所以选择pandas的dataframe来保存到csv文件是最简单的方法. 基本操作下图是DataFrame的一些基本概念,可以看出与基本的csv结构是保持一致的. 1. 创建DataFrame 创建DataFrame通常有两种方法,从list中创建和从dict中创建: 从dict创建,key的名字会作为名,如下所示: >>> d = {'col1': [1, 2], 'col2': [3, 4]