Pandas Series笔记

1.指向单元素的,类型为元素的类型

2.指向多个元素的,类型为Series

3.如果用索引切片,索引是非整型的,实际按照索引顺序取值,且包含末端

4.如果指定的索引不存在,则会报错

5.可以根据元素的条件选择

6.可以有name、index、values三个属性

7.in针对的是索引

8.指定索引创建Series时,结果和索引完全一致,没有索引项的数据被丢弃

9.isnull和notnull或者比较函数,返回一个同结构的bool数组,可以用于选择内容(同5)

时间: 2024-12-28 21:45:44

Pandas Series笔记的相关文章

pandas数组(pandas Series)-(2)

pandas Series 比 numpy array 要强大很多,体现在很多方面 首先, pandas Series 有一些方法,比如: describe 方法可以给出 Series 的一些分析数据: import pandas as pd s = pd.Series([1,2,3,4]) d = s.describe()print(d) count 4.000000 mean 2.500000 std 1.290994 min 1.000000 25% 1.750000 50% 2.5000

pandas数组(pandas Series)-(3)向量化运算

这篇介绍下有index索引的pandas Series是如何进行向量化运算的: 1. index索引数组相同: s1 = pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd']) s2 = pd.Series([10, 20, 30, 40], index=['a', 'b', 'c', 'd']) print s1 + s2 a 11 b 22 c 33 d 44 dtype: int64 直接把各个索引对应的值进行相加 2. index索引数组值

pandas数组(pandas Series)-(4)NaN的处理

上一篇pandas数组(pandas Series)-(3)向量化运算里说到,将两个 pandas Series 进行向量化运算的时候,如果某个 key 索引只在其中一个 Series 里出现,计算的结果会是 NaN ,那么有什么办法能处理 NaN 呢? 1.  dropna() 方法: 此方法会把所有为 NaN 结果的值都丢弃,相当于只计算共有的 key 索引对应的值: import pandas as pd s1 = pd.Series([1, 2, 3, 4], index=['a', '

pandas数组(pandas Series)-(5)apply方法自定义函数

有时候需要对 pandas Series 里的值进行一些操作,但是没有内置函数,这时候可以自己写一个函数,使用 pandas Series 的 apply 方法,可以对里面的每个值都调用这个函数,然后返回一个新的 Series import pandas as pd s = pd.Series([1, 2, 3, 4, 5]) def add_one(x): return x + 1 print s.apply(add_one) # 结果: 0 2 1 3 2 4 3 5 4 6 dtype:

pandas 学习笔记

读者只需浏览一下本文的目录结构,我相信就已经掌握了1到2成的 pandas 知识. 本文的目的是建立一个大概的知识结构 在数据挖掘python阅读源码时,断断续续查阅了些 pandas 资料,并在源码中大致感受到了 pandas 在数据清理方面的方便性. 先将自己查阅的资料结合实际应用中常用到的方式,以学习笔记的形式整理出来.不会涉及到 pandas 的所有方面,细节知识还需自行查阅官方文档. 数据结构 Series: 一维数组,与Numpy中的一维array类似.二者与Python基本的数据结

pandas学习笔记

引入所需要的包: import pandas as pd import numpy as np import matplotlib.pyplot as plt 一.创建对象 通过传递一个list对象来创建一个Series s = pd.Series([1,3,5,np.nan,6,8]) >>> s 0 1.0 1 3.0 2 5.0 3 NaN 4 6.0 5 8.0 dtype: float64 通过传递一个numpy array,时间索引以及列标签来创建一个DataFrame at

pandas Series KeyError: -1

前几天写分析方法,遇到的一个错误: 具体我已经在stackoverflow 里面得到了详细的解答,下面我把问题和解决办法总结一下,方便日后的回顾 问题: sql = "select {}, {} from {} where {};".format(v1, v2, table, where) df = pd.read_sql(sql, app.config.get('sqlalchemy_engine')) df_dropna = df.dropna() dddd = df_dropna

Pandas学习笔记,字符串方法(string method)

一般语法格式Series.str.method().具体方法见http://pandas.pydata.org/pandas-docs/stable/api.html#string-handling 例如 Series.str.capitalize() 作用:Convert strings in the Series/Index to be capitalized.

Pandas练习笔记——(一)

import numpy as np import pandas as pd s = pd.Series([12,-4,4,8]) s Out[4]: 0 12 1 -4 2 4 3 8 dtype: int64 s = pd.Series([12,-4,4,8],index=['a','b','c','d']) s Out[6]: a 12 b -4 c 4 d 8 dtype: int64 s.values Out[7]: array([12, -4, 4, 8], dtype=int64)