【学习】pandas 笔记摘要 【pandas】

本文来源于《利用python进行数据分析》中文版,大家有兴趣可以看原版,入门的东西得脚踏实地哈

1、pandas 数据结构介绍

首先熟悉它的两个主要数据结构,Series 和 DataFrame

Series 是一种类似于一维数组的对象,它由一组数据以及一组与之相关的数据标签组成。

obj = pd.Series([4, 7, -5, 3])

obj
Out[4]:
0    4
1    7
2   -5
3    3
dtype: int64

Series字符串表现形成为:索引在左,值在右,可以通过Series的values和index属性获取其数组表示形式和索引对象

obj.values
Out[5]: array([ 4,  7, -5,  3], dtype=int64)
obj.index
Out[6]: RangeIndex(start=0, stop=4, step=1)

对各个数据点进行标记索引

obj2 = pd.Series([4, 7], index =[‘d‘, ‘b‘])

obj2
Out[8]:
d    4
b    7
dtype: int64

Numpy数组运算会保留索引和值之间的链接

还可以将Series看成是一个定长的有序字典,因为它是索引值到数据值的一个映射。

如果数据被存入在一个python字典中,也可以直接通过这个字典来创建Series

sdata = {‘name1‘: ‘tom‘, ‘name2‘: ‘Jerry‘}

obj3 = pd.Series(sdata)

obj3
Out[11]:
name1      tom
name2    Jerry
dtype: object

如果只传入一个字典,则结果Series中的索引就是原字典的键(有序排列)

states = [‘name1‘, ‘name2‘, ‘name3‘]

obj4 = pd.Series(sdata, index = states)

obj4Out[17]: name1      tomname2    Jerryname3      NaNdtype: object#注意找不到是直接变为NaN

pandas 的isnull 和 notnull 函数可用于检测缺失数据

对于许多应用而言, Series最重要的一个功能是:它在算术运算中会自动对齐不同索引的数据。

Series的索引可以通过赋值的方式就地修改

==========================================================================================

DataFrame是一个表格型的数据结构,它含有一组有序的列,每列可以是不同中的值类型(数值、字符串、布尔值等)。DataFrame即有行索引也有列索引,它可以被看做由Series

组成的字典(共用同一索引)。DataFrame中面向行和列的操作基本上是平衡的。其实DataFrame中的数据是以一个或多个二维块存放的,而不是列表、字典或别的一维数据结构。

(注意:虽然DataFrame是以二维结构保存数据的,但你仍然可以轻松地将其表示为更高维度的数据,层次 化索引的表格型结构,这是pandas中许多高级数据处理功能的关键要素)

时间: 2024-08-04 22:18:50

【学习】pandas 笔记摘要 【pandas】的相关文章

20180426学习python笔记(pandas使用)

原文地址:https://www.cnblogs.com/beijingjiaotongdaxue/p/8955138.html

Tensor flow 实战Google深度学习框架 笔记摘要Pone

<Tensor flow 实战Google深度学习框架>前三章的摘要(没有简介和环境搭建的部分) 摘要的内容是 与tensorflow 语句相关的知识 如有违规之类的请通知我啊 这个pdf 一般bd有 需要的可以私聊我 或者留下扣扣邮箱 欢迎指点 注:本来是要直接粘word 但是 word能粘截图 我就一个一个 传上来的   第一篇微博~~~ 1表示用户信息 结构化数据 .name:张三 .Id:12345 .Email:[email protected]   xml形式 <user&g

Tensor flow 实战Google深度学习框架 笔记摘要Pfour(二)

6.4经典卷积网络模型 LeNet-5模型 Inception-v3模型 6.5卷积神经网络迁移学习 原文地址:https://www.cnblogs.com/IAMzhuxiaofeng/p/8695959.html

Python学习教程(Python学习路线):Pandas库基础分析-详解时间序列的处理

Python学习教程(Python学习路线):Pandas库基础分析-详解时间序列的处理 在使用Python进行数据分析时,经常会遇到时间日期格式处理和转换,特别是分析和挖掘与时间相关的数据,比如量化交易就是从历史数据中寻找股价的变化规律.Python中自带的处理时间的模块有datetime,NumPy库也提供了相应的方法,Pandas作为Python环境下的数据分析库,更是提供了强大的日期数据处理的功能,是处理时间序列的利器. 1.生成日期序列 主要提供pd.data_range()和pd.p

pandas笔记

Pandas的数据类型 Pandas基于两种数据类型: series 与 dataframe . Series 一个series是一个一维的数据类型,其中每一个元素都有一个标签.类似于Numpy中元素带标签的数组.其中,标签可以是数字或者字符串. import numpy as np import pandas as pd s = pd.Series([1, 2, 5, np.nan, 6, 8]) print s DataFrame 一个dataframe是一个二维的表结构.Pandas的da

Python 笔记 #13# Pandas: Viewing Data

感觉很详细:数据分析:pandas 基础 import pandas as pd import numpy as np import matplotlib.pyplot as plt dates = pd.date_range('20180116', periods=3) # 创建 16 17 18 等六个日期 df = pd.DataFrame(np.random.randn(3,4), index=dates, columns=list('ABCD')) # 这是二维的,类似于一个表! #

pandas小记:pandas数据结构及基本功能

http://blog.csdn.net/pipisorry/article/details/18010307 pandas的数据 结构:Series.DataFrame.索引对象pandas基本功能:重新索引,丢弃指定轴上的项,索引.选取和过滤,算术运算和数据对齐,函数应用和映射,排序和排名,带有重复值的轴索引 Pandas介绍 pandas含有使数据分析工作变得更快更简单的高级数据结构和操作工具.它是基于NumPy构建的,让以NumPy为中心的应用变得更加简单. 通常建议你先学习NumPy,

Android群英传笔记——摘要,概述,新的出发点,温故而知新,能够为师矣!

Android群英传笔记--摘要.概述,新的出发点,温故而知新.能够为师矣! 当工作的越久,就越感到力不从心了,基础和理解才是最重要的,所以买了两本书,医生的<Android群英传>和主席的<Android开发艺术探索>.主要是再全面点的把自己所学的知识消化,这样也就不枉自己天天熬夜学习了,如今群英传快看完了.准备又一次再看一遍,同一时候把笔记以博客的形式记录下来,这样或许更加的深刻,然后再消磨一下主席的那本书,这本书有视频解说,更加好,所以估计以后应该非常少再写其它的博客,只是工

[SQLServer]学习总结笔记(基本涵盖Sql的所有操作)

--################################################################################### /* 缩写: DDL(Database Definition Language): 数据库定义语言 DML(Database Manipulation Language): 数据库操作语言 DCL(Database Control Language): 数据库控制语言 DTM(Database Trasaction Manag