利用python数据分析panda学习笔记之DataFrame

2 DataFrame

  a:通过传入一个等长的列表构成DataFrame 自动加上索引

1 data={‘state‘:[‘ohio‘,‘ohio‘,‘ohio‘,‘Nevada‘,‘Nevada‘],
2       ‘year‘:[2000,2001,2002,2001,2002],
3       ‘pop‘:[1.5,1.7,3.6,2.1,2.9]}
4 frame=DataFrame(data)

  b:指定顺序序列(之前是按照默认排序)

1 DataFrame(data,columns=[‘year‘,‘state‘,‘pop‘])

  c:传入数据的时候列不存在 那么就是NAN

  d:从DataFrame中获取一个series

1 frame2.year

  e:赋值方式修改列

1 frame2[‘debt‘]=16.5
2 frame2

  f:赋值的时候如果传入一个Series,那么可以进行精确的匹配,空位为缺省值

1 var = Series([-1.2,-1.5,-1.7],index=[‘two‘,‘four‘,‘five‘])
2 frame2[‘debt‘]=var
3 frame2

  g:为不存在列进行赋值,那么会创建一个新的列。删除用del

1 #为不存在的列进行赋值 那么会创建一个新列
2 frame2[‘eastern‘]=frame2.state==‘ohio‘
3 frame2
4
5 #删除列
6 del frame2[‘eastern‘]

2 传入的是字典的字典--->外层字典键作为列,内层键作为行索引,此时内层字典的键会被合并

1 #传入的是字典的字典
2 pop={‘Nevada‘:{2001:2.4,2002:2.9},
3      ‘ohio‘:{2000:1.5,2001:1.7,2002:3.6}}
4 frame3=DataFrame(pop)

  a:进行装置 --->frame3.T

  b:如果设置了Dataframe的index和columns的name属性 这些会被显示出来

1 #如果设置了Dataframe的index和columns的name属性 这些会被显示出来
2 frame3.index.name=‘year‘;
3 frame3.columns.name=‘state‘
4 frame3

  c:values会以二维ndarray返回---->frame3.values

3 索引对象(续)

时间: 2024-11-18 09:00:01

利用python数据分析panda学习笔记之DataFrame的相关文章

利用python数据分析panda学习笔记之Series

1 Series a:类似一维数组的对象,每一个数据与之相关的数据标签组成 b:生成的左边为索引,不指定则默认从0开始. 1 from pandas import Series,DataFrame 2 import pandas as pd 3 #series 一组数据与相关得数据标签组成 4 obj=Series([4,7,-5,3]) 5 obj#索引在左边 值在右边 c:可以通过values和index属性获取数组的表示形式和索引对象 1 obj.values#array([ 4, 7,

利用python数据分析panda学习笔记之基本功能

1 重新生成索引 如果某个索引值不存在就引入缺失值 1 from pandas import Series,DataFrame 2 import pandas as pd 3 import numpy as np 4 obj=Series([4.5,7.2,-5.3,3.6],index=['d','b','a','c']) 5 obj 6 7 #重新生成索引 8 obj2=obj.reindex(['a','b','c','d','e']) 9 obj2 a使用method的ffill可以实现

python数据分析入门学习笔记儿

学习利用python进行数据分析的笔记儿&下星期二内部交流会要讲的内容,一并分享给大家.博主粗心大意,有什么不对的地方欢迎指正~还有许多尚待完善的地方,待我一边学习一边完善~ 前言:各种和数据分析相关python库的介绍(前言1~4摘抄自<利用python进行数据分析>) 1.Numpy: Numpy是python科学计算的基础包,它提供以下功能(不限于此): (1)快速高效的多维数组对象naarray (2)用于对数组执行元素级计算以及直接对数组执行数学运算的函数 (3)用于读写硬盘

python网络爬虫学习笔记

python网络爬虫学习笔记 By 钟桓 9月 4 2014 更新日期:9月 4 2014 文章目录 1. 介绍: 2. 从简单语句中开始: 3. 传送数据给服务器 4. HTTP头-描述数据的数据 5. 异常 5.0.1. URLError 5.0.2. HTTPError 5.0.3. 处理异常 5.0.4. info和geturl 6. Opener和Handler 7. Basic Authentication 8. 代理 9. Timeout 设置 10. Cookie 11. Deb

利用Python数据分析可以实现些什么功能呢?

随着大数据时代的来临和Python编程语言的火爆,Python数据分析早已成为现在职场人的必备核心技能.那么利用Python数据分析可以做什么呢?简单来说,可以做到的内容有很多,比如检查数据表.数据表清洗.数据预处理.数据提取和数据筛选汇总等等.下面来为大家详细讲解一下这些用处 1.检查数据表 Python中使用shape函数来查看数据表的维度,也就是行数和列数.你可以使用info函数查看数据表的整体信息,使用dtypes函数来返回数据格式.Isnull是Python中检验空值的函数,你可以对整

Python高级特性——学习笔记

Python中非常有用的高级特性,1行代码能实现的功能,决不写5行代码.请始终牢记,代码越少,开发效率越高. 1.切片slice.L = [1, 2, 3, 4, 5] L[0:3]=[1,2,3]表示,从索引0开始取,直到索引3为止,但不包括索引3.即索引0,1,2,正好是3个元素. 如果第一个索引是0,还可以省略 倒数切片L[-2:]=[4,5]从倒数第二个数 到 最后一个数 L = list(range(100))# 创建一个0-99的数列L L[:10:2]# 前10个数,每两个取一个

&lt;&lt;Python基础教程&gt;&gt;学习笔记之|第01章|基础知识

本学习笔记主要用要记录下学习<<Python基础教程>>过程中的一些Key Point,或自己没怎么搞明白的内容,可能有点杂乱,但比较实用,查找起来也方便. 第01章:基础知识 ------ Jython:      Python的Java实现,运行在JVM中,相对稳定,但落后于Python,当前版本2.5,在TA(Python+Robot)会用到 IronPython:  Python的C#实现,运行在Common Language Runtime,速度比Python要快 >

Selenium2 Python 自动化测试实战学习笔记(六)

1.1 创建定时任务 为了让自动化测试"自动化"起来,现在我们来创建定时任务,使自动化测试脚本在指定的时间自动化运行.创建定时任务的方法有很多,比如,我们可以写一段程序让其在指定的时间运行all_test.py 文件,或者使用系统的定时任务功能在指定的时间运行all_test.py文件. 在python的os模块中提供了system()用来执行系统命令.比如要执行:UnitTest\Project\run_all.py 可以这样实现:start_run.py #coding=utf-8

Python Panda - 学习笔记

#Group by Function df.groupby('Date')[['Date']].count() df.groupby('Date')[['Date']].sum() # if it can be sumable #Sort Function type(df['Date']) <class 'pandas.core.series.Series'> df['Date'].sort_values() #View all types of each Column df.dtypes #