Pandas | 01 数据结构

Pandas的三种数据结构:

  • 系列(Series)
  • 数据帧(DataFrame)
  • 面板(Panel)

这些数据结构,构建在Numpy数组之上,这意味着它们很快

维数和描述

考虑这些数据结构的最好方法是,较高维数据结构是其较低维数据结构的容器。 例如,DataFrameSeries的容器,PanelDataFrame的容器。

数据结构 维数 描述
系列 1 1D标记均匀数组,大小不变。
数据帧 2 一般2D标记,大小可变的表结构与潜在的异质类型的列。
面板 3 一般3D标记,大小可变数组。

构建和处理两个或更多个维数组是一项繁琐的任务,用户在编写函数时要考虑数据集的方向。 但是使用Pandas数据结构,减少了用户的思考。例如,使用表格数据(DataFrame),在语义上更有用于考虑索引(行)和列,而不是轴0和轴1

可变性

所有Pandas数据结构是值可变的(可以更改),除了系列都是大小可变的。系列是大小不变的。

注 - DataFrame被广泛使用,是最重要的数据结构之一。面板使用少得多。

一、系列

系列是具有均匀数据的一维数组结构。例如,以下系列是整数:10,23,56...的集合。

关键点

  • 均匀数据
  • 尺寸大小不变
  • 数据的值可变

二、数据帧

数据帧(DataFrame)是一个具有异构数据的二维数组。 例如,

姓名 年龄 性别 等级
Maxsu 25 4.45
Katie 34 2.78
Vina 46 3.9
Lia x女 4.6

上表数据以行和列表示。每列表示一个属性,每行代表一个人。

列的数据类型

上面数据帧中四列的数据类型如下:

类型
姓名 字符串
年龄 整数
性别 字符串
等级 浮点型

关键点

  • 异构数据
  • 大小可变
  • 数据可变

三、面板

面板是具有异构数据的三维数据结构。在图形表示中很难表示面板。但是一个面板可以说明为DataFrame的容器。

关键点

  • 异构数据
  • 大小可变
  • 数据可变

原文地址:https://www.cnblogs.com/Summer-skr--blog/p/11703942.html

时间: 2024-08-03 10:10:27

Pandas | 01 数据结构的相关文章

Pandas的使用(3)---Pandas的数据结构

Pandas的使用(3) Pandas的数据结构 1.Series 2.DataFrame

pandas的数据结构之一series

Pandas的数据结构 1.Series Series是一种类似于一维数组的对象,由下面两个部分组成: index:相关的数据索引标签 values:一组数据(ndarray类型) series的创建方法: 1.直接传入一个列表 s1 = Series([1,2,3,4])s1 0 1 1 2 2 3 3 4 dtype: int64 查看series对象的属性: s1.index # 索引 s1.values 还可以带上index参数,表示里这个参数作为索引 s2 = Series(data=

pandas 的数据结构(Series, DataFrame)

Pandas 讲解 Python Data Analysis Library 或 pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的. Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具. pandas提供了大量能使我们快速便捷地处理数据的函数和方法.你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一. Series:一维数组,与Numpy中的一维array类似. 二者与Python基本的数据结构List也

pandas的数据结构

pandas的两个主要的数据结构: Series series是一种类似于一维数组的对象,它由一组数据(NumPy数组类型的数据)和一组与之相关的数据标签(索引)组成. 1 from pandas import Series 2 3 obj = Series((1,2,3,4,5)) 4 obj.index #索引,默认从0开始的整数 5 obj.values #array数组 6 7 #自定义索引的Series 8 obj_with_index = Series([4,65,3,4],inde

01.数据结构概念与算法基础

数据结构概念与算法基础 一.数据结构概念 1.数据:是描述客观事务的符号,是计算机中可以操作的对象,是能被计算机识别,并输入给计算机处理的符号集合.数据不仅仅包括整型.实型等数值类型,还包括字符及声音.图像.视频等非数值类型. 2.数据元素:是组成数据的.有一定意义的基本单位,在计算机中通常作为整体处理,也被成为记录.比如畜类中,牛.马.羊都属于数据元素. 3.数据项:一个数据元素可以由若干个数据项组成,数据项是数据不可分割的最小单位.比如人这样的数据元素,可以有眼.耳.鼻等数据项. 4.数据对

3、pandas的数据结构之Series——增删改数据

一.修改Series  二.Series增加数据 append函数和列表的append函数类似,将另外一个series连接在某series后边. Series删除数据 删除在Series很少用.常用布尔选择或mask来选择数据组成新的Series,而原来的Series没有变 原文地址:https://www.cnblogs.com/yhms/p/12244014.html

pandas数据分析(数据结构)

本文主要从以下两个方向对pandas的数据结构进行展开,分别为Series和DataFrame(对应的分别是系列与numpy中的一维数组和二维数组) 1.首先从Series讲起,主要介绍Series的创建. 1) 可以通过一位数组进行创建序列 如:在python3.6中测试 #首先导入两个模块, import numpy as np import pandas as pd #创建第一个序列 array1=np.arange(10) print (array1) print(type(array1

Numpy常用数据结构、数据清洗函数、数据结构series和方法、数据结构dataframe和方法

Numpy常用数据结构 1. 数组创建 In [ ]: # 导入库 import numpy as np In [ ]: arr1 = np.array([-9,7,4,3]) In [ ]: arr1 In [ ]: arr2 = np.array([-9,7,4,3],dtype =float)# 尝试改变为int或者str In [ ]: print(arr2) In [ ]: arr3 = np.array([[1,2,3,4],[5,6,7,8],[9,10,11,12]]) In [

Pandas 精简实例入门

import pandas as pd import numpy as np 0. 案例引入 # 由np直接生成的ndarray stock_change = np.random.normal(0, 1, (10, 8)) stock_change array([[ 0.74057955, 0.78604657, -0.15264135, 0.05680483, 0.09388135, 0.7313751 , -1.52338443, 1.71156505], [ 0.42204925, 0.6