利用python数据分析panda学习笔记之Series

1 Series

  a:类似一维数组的对象,每一个数据与之相关的数据标签组成

  b:生成的左边为索引,不指定则默认从0开始。

1 from pandas import Series,DataFrame
2 import pandas as pd
3 #series 一组数据与相关得数据标签组成
4 obj=Series([4,7,-5,3])
5 obj#索引在左边 值在右边

c:可以通过values和index属性获取数组的表示形式和索引对象

1 obj.values#array([ 4,  7, -5,  3], dtype=int64)
2 obj.index

d:跟定索引值

1 obj2=Series([4,7,-5,3],index=[‘d‘,‘b‘,‘a‘,‘c‘])
2 obj2
3 obj2.index

e:通过索引值得到值

1 obj2[‘a‘]
2 obj2[[‘c‘,‘a‘,‘d‘]]
3 obj2[obj2>0]

f:如果数据在python字典中 可以直接通过字典来创建Series

1 sdata={‘ohio‘:35000,‘Texas‘:71000,‘Oregon‘:16000,‘Utah‘:5000}
2 obj3=Series(sdata)
3 obj3

g:Series中非常重要的功能就是在多个Series运算的时候会自动匹配相同的索引进行操作

 1 #如果数据在Python字典中 可以直接通过这个字典来创建Series
 2 sdata={‘ohio‘:35000,‘Texas‘:7100,‘Oregon‘:1600,‘Utah‘:5000}
 3 obj3=Series(sdata)
 4 obj3
 5
 6 #如果只是传入一个字典 那么结果Series中索引就是字典得键 缺失为nan
 7 states=[‘California‘,‘ohio‘,‘Oregon‘,‘Texas‘]
 8 obj4=Series(sdata,index=states)
 9
10 #使用isnull notnull判断缺失值
11
12
13 #Series中一个非常重要的功能就是在算数运算中自动对其不同索引得数据
14 obj3
15 obj4
16 obj3+obj4

   

  h:series中有个特别的属性 name属性

1 bj4.name=‘population‘
2 obj4.index.name=‘state‘
3 ob

时间: 2024-08-26 03:13:15

利用python数据分析panda学习笔记之Series的相关文章

利用python数据分析panda学习笔记之基本功能

1 重新生成索引 如果某个索引值不存在就引入缺失值 1 from pandas import Series,DataFrame 2 import pandas as pd 3 import numpy as np 4 obj=Series([4.5,7.2,-5.3,3.6],index=['d','b','a','c']) 5 obj 6 7 #重新生成索引 8 obj2=obj.reindex(['a','b','c','d','e']) 9 obj2 a使用method的ffill可以实现

利用python数据分析panda学习笔记之DataFrame

2 DataFrame a:通过传入一个等长的列表构成DataFrame 自动加上索引 1 data={'state':['ohio','ohio','ohio','Nevada','Nevada'], 2 'year':[2000,2001,2002,2001,2002], 3 'pop':[1.5,1.7,3.6,2.1,2.9]} 4 frame=DataFrame(data) b:指定顺序序列(之前是按照默认排序) 1 DataFrame(data,columns=['year','st

python数据分析入门学习笔记儿

学习利用python进行数据分析的笔记儿&下星期二内部交流会要讲的内容,一并分享给大家.博主粗心大意,有什么不对的地方欢迎指正~还有许多尚待完善的地方,待我一边学习一边完善~ 前言:各种和数据分析相关python库的介绍(前言1~4摘抄自<利用python进行数据分析>) 1.Numpy: Numpy是python科学计算的基础包,它提供以下功能(不限于此): (1)快速高效的多维数组对象naarray (2)用于对数组执行元素级计算以及直接对数组执行数学运算的函数 (3)用于读写硬盘

python网络爬虫学习笔记

python网络爬虫学习笔记 By 钟桓 9月 4 2014 更新日期:9月 4 2014 文章目录 1. 介绍: 2. 从简单语句中开始: 3. 传送数据给服务器 4. HTTP头-描述数据的数据 5. 异常 5.0.1. URLError 5.0.2. HTTPError 5.0.3. 处理异常 5.0.4. info和geturl 6. Opener和Handler 7. Basic Authentication 8. 代理 9. Timeout 设置 10. Cookie 11. Deb

利用Python数据分析可以实现些什么功能呢?

随着大数据时代的来临和Python编程语言的火爆,Python数据分析早已成为现在职场人的必备核心技能.那么利用Python数据分析可以做什么呢?简单来说,可以做到的内容有很多,比如检查数据表.数据表清洗.数据预处理.数据提取和数据筛选汇总等等.下面来为大家详细讲解一下这些用处 1.检查数据表 Python中使用shape函数来查看数据表的维度,也就是行数和列数.你可以使用info函数查看数据表的整体信息,使用dtypes函数来返回数据格式.Isnull是Python中检验空值的函数,你可以对整

Python高级特性——学习笔记

Python中非常有用的高级特性,1行代码能实现的功能,决不写5行代码.请始终牢记,代码越少,开发效率越高. 1.切片slice.L = [1, 2, 3, 4, 5] L[0:3]=[1,2,3]表示,从索引0开始取,直到索引3为止,但不包括索引3.即索引0,1,2,正好是3个元素. 如果第一个索引是0,还可以省略 倒数切片L[-2:]=[4,5]从倒数第二个数 到 最后一个数 L = list(range(100))# 创建一个0-99的数列L L[:10:2]# 前10个数,每两个取一个

&lt;&lt;Python基础教程&gt;&gt;学习笔记之|第01章|基础知识

本学习笔记主要用要记录下学习<<Python基础教程>>过程中的一些Key Point,或自己没怎么搞明白的内容,可能有点杂乱,但比较实用,查找起来也方便. 第01章:基础知识 ------ Jython:      Python的Java实现,运行在JVM中,相对稳定,但落后于Python,当前版本2.5,在TA(Python+Robot)会用到 IronPython:  Python的C#实现,运行在Common Language Runtime,速度比Python要快 >

Selenium2 Python 自动化测试实战学习笔记(六)

1.1 创建定时任务 为了让自动化测试"自动化"起来,现在我们来创建定时任务,使自动化测试脚本在指定的时间自动化运行.创建定时任务的方法有很多,比如,我们可以写一段程序让其在指定的时间运行all_test.py 文件,或者使用系统的定时任务功能在指定的时间运行all_test.py文件. 在python的os模块中提供了system()用来执行系统命令.比如要执行:UnitTest\Project\run_all.py 可以这样实现:start_run.py #coding=utf-8

Python Panda - 学习笔记

#Group by Function df.groupby('Date')[['Date']].count() df.groupby('Date')[['Date']].sum() # if it can be sumable #Sort Function type(df['Date']) <class 'pandas.core.series.Series'> df['Date'].sort_values() #View all types of each Column df.dtypes #