pandas基础学习(1)

1.介绍

pandas是常用的数据分析库,用于处理表格型或者异质性数据,主要有两种数据类型:Series和DataFrame。

本文采用的是Jupyter notebook , 导入库语句:import pandas as pd

Series是一维数据型对象,粗略的理解,有一点似于C语言中的数组值values+可重新命名的index,即索引,可以认为是一个长度固定的字典。是DataFrame的组成部分。

DataFrame是二维结构,是一张表,有两条轴,axis=0(index行)与 axis=1(columns列) 。与R语言的数据框类似,每一个列(属性列)数据类型可不同,分析的范围较广。

2.创建

Series的创建比较简单,可将列表类型、字典类型直接转换,或者调用numpy中的arange生成。

DataFrame的创建常用是用字典类型,键转换为columns,或者调用numpy.arange.reshape()生成数据,在创建时可创建列名的列表,调用columns进行赋值。

二者共同之处在于,index是否重命名,默认为从0开始,步长为1的递增数列。

例如:

另:在创建过程中可能会出现数据缺失(NA),可用isnull或者notnull来进行检测,返回值为True或False。

3.DataFrame基本操作

(1)查:

列查找:

方式1::‘索引’,即用 [] 调用索引和列名直接检索。

若对行也有要求:

特别说明:Series切片包含尾部!与列表切片不同!

方式2:条件(如=、!=)布尔值进行过滤的检索

行查找:

调用函数:loc(轴标签 即名称)和iloc函数(整数标签 即序列号)进行选取。

南京序列号为2,则用iloc同样可以检索到:

(2)删:

方式1:运用python的关键字 del。

删去一个属性列

 特别说明:从DataFrame选取的列是数据的视图,对Series的操作会反映到DataFrame中。

方式2:运用drop函数

说明:

a.默认是删除索引行,若要删除列,则需设置参数axis=1。

b.默认返回的是新对象,原数据没有发生更改。

c.设置inplace=True ,修改的是原数据。

(3)改:

方法一:(此为原DataFrame被更改)

列的引用是可以修改的。

一旦索引对象确定,是不可变的,用户不可以进行修改。

方法二:reindex方法,利用index进行重新行排序,列可以用columns关键字,若数据缺失可选择填充。

例1:

例2:

 特别注意:此时的原data并没有发生改变。

原文地址:https://www.cnblogs.com/sept/p/12443141.html

时间: 2024-10-07 22:55:09

pandas基础学习(1)的相关文章

Pandas基础学习与Spark Python初探

摘要:pandas是一个强大的Python数据分析工具包,pandas的两个主要数据结构Series(一维)和DataFrame(二维)处理了金融,统计,社会中的绝大多数典型用例科学,以及许多工程领域.在Spark中,python程序可以方便修改,省去java和scala等的打包环节,如果需要导出文件,可以将数据转为pandas再保存到csv,excel等. 1.Pandas是什么? pandas是一个强大的Python数据分析工具包,是一个提供快速,灵活和表达性数据结构的python包,旨在使

pandas基础学习一

生成对象 用值列表生成 Series 时,Pandas 默认自动生成整数索引: In [3]: s = pd.Series([1, 3, 5, np.nan, 6, 8]) In [4]: s Out[4]: 0 1.0 1 3.0 2 5.0 3 NaN 4 6.0 5 8.0 dtype: float64 用含日期时间索引与标签的 NumPy 数组生成 DataFrame: In [5]: dates = pd.date_range('20130101', periods=6) In [6]

numpy+pandas 基础学习

#-*- coding:utf-8 -*- import numpy as np; data1=[1,2,3,4,5] array1=np.array(data1) #创建数组/矩阵 # 使用numpy中的array函数 data2=[[1,3,4],[2,5,6]] array2=np.array(data2) #查看变量的数据类型:dtype array2.dtype #转换数据格式 astype array2_str=array2.astype('str') array2_str.dtyp

pandas 基础学习

import numpy as np import pandas as pd s = pd.Series([1, 3, 6, np.nan, 10, 23]) print(s) dates = pd.date_range('20180101', periods=4) print(dates) df = pd.DataFrame(np.random.randn(4, 5), index=dates, columns=['a', 'b', 'c', 'd', 'e']) print(df) df =

python学习笔记(四):pandas基础

pandas 基础 serise import pandas as pd from pandas import Series, DataFrame obj = Series([4, -7, 5, 3]) obj 0 4 1 -7 2 5 3 3 dtype: int64 obj.values array([ 4, -7, 5, 3], dtype=int64) obj.index RangeIndex(start=0, stop=4, step=1) obj[[1,3]] # 跳着选取数据 1

蓝鸥零基础学习HTML5—html+css基础

蓝鸥零基础学习HTML5-html+css基础 一.课程目标 1.了解前端开发职位:2.掌握常用标签以及语义及用法:3.掌握常用css的特性,掌握基础布局技巧:4.掌握整站规划概念. 二.适用人群 零基础积极学习html5者 三.课程简介 本课程主要讲解了 html+css的基础知识,包括html模板.标签.css基础样式.布局.表格表单.整站等等,是进行前端开发的基础.Html+css是前端开发的基础,大部分前端开发工程都需要从html+css布局开始,html+css的基础非常重要,是前端开

HTML&CSS基础学习笔记8-预格式文本

<pre>标签的主要作用是预格式化文本.被包围在 pre 标签中的文本通常会保留空格和换行符.而文本也会呈现为等宽字体. <pre>标签的一个常见应用就是用来表示计算机的源代码.当然你也可以在你需要在网页中预显示格式时使用它. 会使你的文本换行的标签(例如<h>.<p>)绝不能包含在 <pre> 所定义的块里.尽管有些浏览器会把段落结束标签解释为简单地换行,但是这种行为在所有浏览器上并不都是一样的. 更多学习内容,就在码芽网http://www.

Objc基础学习记录5

NSMutableString类继承的NSString类. NSMutableString是动态的字符串. 1.appendingString 方式: 向字符串尾部添加一个字符串. 2.appendingFormat:可以添加多个类型的字符串. int,chat float,double等 3.stringWithString 创建字符串, 4.rangeOfString 返回str1在另一个字符串中的位置. 5.NSMakeRange(0,3) 字符串0位到3位. 6.deleteCharac

Linux新手入门书籍推荐 鸟哥的linux私房菜-基础学习篇

这本书写的不错.赞~\(≧▽≦)/~ 2017-02-24 下午,我开始在Linux下写第一个.c程序,在终端打印hello world.gcc 源代码文件之后,输出可执行文件,但是 当我输入文件名执行它的时候,却提示我 无法找到命令.于是我找百度,查资料,花了半个小时,终于找到解决方法了, 输入"./filename"即可.... 2017-02-25 我看<基础学习篇>这本书,在P158页下面的例题讲解中找到了昨天下午异常的解析.我就很是感慨,心想:要是早看这本书,半个