Pandas库01_Series数据类型

#pandas有两个基本数据结构,Series 和 DataFrame,这两种数据类型都带索引
#简单了说,Series是一列数据带索引,DataFrame是像表格一样的数据结构带索引

import pandas as pd

#创建Series数据,两种方式,一种系统指派索引,二种是自己创建索引
# objs1=pd.Series([1,2,3,-2,2,8,2])
# print(objs1) #这是一个带索引值的数据,从0开始,像字典又不是字典
# print(type(objs1)) #<class ‘pandas.core.series.Series‘>
#
# objs2=pd.Series([1,2,3,4,1,5,3],index=["a","b","c","d","e","f","g"])
# print(objs2)

#数据访问
# objs3=pd.Series([1,2,3,4,1,5,3],index=["a","b","c","d","e","f","g"])
# print(objs3.index) #Index([‘a‘, ‘b‘, ‘c‘, ‘d‘, ‘e‘, ‘f‘, ‘g‘], dtype=‘object‘)
# print(objs3.values) #[1 2 3 4 1 5 3]
# print(objs3["c"]) #指定索引后,系统索引仍然在,可以用objs3[0]等访问值
#
# objs4=pd.Series([1,2,3,-2,2,8,2]) #系统指定索引
# print(objs4.index) #RangeIndex(start=0, stop=7, step=1)
# print(list(objs4.index)) #[0, 1, 2, 3, 4, 5, 6]
# print(objs4.values) #[ 1 2 3 -2 2 8 2]
# print(objs4[4])
# print(objs4[objs4<3]) #还可以条件筛选,得到的是索引加值的新objs,不改变原数据
# print(objs4)

#也可以通过字典来创建
# objs5=pd.Series({"tanghao":"唐浩","xiaofeng":"小风","laowang":"老王"})
# print(objs5)
# print("________________")
# #定义name属性
# objs5.name="学生表"
# print(objs5)
# print("________________")
# objs5.index.name="学生"
# print(objs5)
# print("________________")
# # objs5.value.name="姓名中文" #错了,没有这个,只能定义index.name

原文地址:https://www.cnblogs.com/yiyea/p/11441787.html

时间: 2024-11-01 11:35:48

Pandas库01_Series数据类型的相关文章

pandas库的DateFrame类型

Series是pandas库的一维数据类型,DateFrame是pandas库的二维数据类型. DateFrame类型: DateFrame类型由共用相同索引的一组列组成(DateFrame相当于一个表格),每列值类型可以不同. DateFrame既有行索引,也有列索引. DateFrame常用于表达二维数据,但可以表达多维数据. DateFrame类型可以由如下类型创建: 1.二维ndarray对象 import pandas as pd import numpy as np d = pd.D

Pandas库中的DataFrame

1 简介 DataFrame是Python中Pandas库中的一种数据结构,它类似excel,是一种二维表. 或许说它可能有点像matlab的矩阵,但是matlab的矩阵只能放数值型值(当然matlab也可以用cell存放多类型数据),DataFrame的单元格可以存放数值.字符串等,这和excel表很像. 同时DataFrame可以设置列名columns与行名index,可以通过像matlab一样通过位置获取数据也可以通过列名和行名定位,具体方法在后面细说. 2 创建DataFrame 首先声

python之pandas库

一.生成数据表 1.首先导入pandas库,一般都会用到numpy库,所以我们先导入备用: import pandas as pd 2.导入CSV或者xlsx文件: df = pd.DataFrame(pd.read_csv('name.csv',header=1)) df = pd.DataFrame(pd.read_excel('name.xlsx')) 3.用pandas创建数据表: df = pd.DataFrame({"id":[1001,1002,1003,1004,100

Python Pandas库的学习(三)

今天我们来继续讲解Python中的Pandas库的基本用法 那么我们如何使用pandas对数据进行排序操作呢? food.sort_values("Sodium_(mg)",inplace= True) print(food["Sodium_(mg)"]) food.sort_values("Sodium_(mg)",inplace=True,ascending= False) print(food["Sodium_(mg)"

Python学习教程(Python学习路线):Pandas库基础分析-详解时间序列的处理

Python学习教程(Python学习路线):Pandas库基础分析-详解时间序列的处理 在使用Python进行数据分析时,经常会遇到时间日期格式处理和转换,特别是分析和挖掘与时间相关的数据,比如量化交易就是从历史数据中寻找股价的变化规律.Python中自带的处理时间的模块有datetime,NumPy库也提供了相应的方法,Pandas作为Python环境下的数据分析库,更是提供了强大的日期数据处理的功能,是处理时间序列的利器. 1.生成日期序列 主要提供pd.data_range()和pd.p

Python的Pandas库简述

pandas 是 python 的数据分析处理库import pandas as pd 1.读取CSV.TXT文件 foodinfo = pd.read_csv("pandas_study.csv", encoding = "utf-8") 2.查看前N条.后N条信息 foodinfo.head(N) foodinfo.tail(N) 3.查看数据框的格式,是DataFrame还是ndarray print(type(foodinfo)) # 结果:<clas

总结(5)--- Numpy和Pandas库常用函数

二.常用库 1.NumPy NumPy是高性能科学计算和数据分析的基础包.部分功能如下: ndarray, 具有矢量算术运算和复杂广播能力的快速且节省空间的多维数组. 用于对整组数据进行快速运算的标准数学函数(无需编写循环). 用于读写磁盘数据的工具以及用于操作内存映射文件的工具. 线性代数.随机数生成以及傅里叶变换功能. 用于集成C.C++.Fortran等语言编写的代码的工具. 首先要导入numpy库:import numpy as np A NumPy函数和属性: 类型 类型代码 说明 i

Pandas库06_DataFrame数据结构_汇总与统计

#这里讲演pandas的汇总与统计import numpy as npimport pandas as pd #我自己的私有函数库,我都加了t_+函数名的t_data={ "name":["唐浩","小王","老王","赵三","李四","王姐"], "sex":["男","女","男",

pandas库学习笔记(一)Series入门学习

Pandas基本介绍: pandas is an open source, BSD-licensed (permissive free software licenses) library providing high-performance, easy-to-use data structures and data analysis tools for the Python programming language. 我们快速简单地看一下pandas中的基本数据结构,先从数据类型.索引.切片等