Pandas库02_DataFrame数据结构

#DataFrame数据结构,很像二维表格数据结构,也是python中最常用的数据结构

import pandas as pd
import numpy as np

#创建DataFrame数据
#先给出一个字典data,我们用字典来创建
data={
"name":["唐浩","小王","老王","赵三","李四"],
"sex":["男","女","男","女","男"],
"year":[37,22,15,18,33],
"city":["成都","北京","上海","成都","深圳"]
}
# df1=pd.DataFrame(data)
# print(df1)
"""
name sex year city
0 唐浩 男 37 成都
1 小王 女 22 北京
2 老王 男 15 上海
3 赵三 女 18 成都
4 李四 男 33 深圳
"""

# df2=pd.DataFrame(data,columns=["name","year","sex","city"]) #指定列名顺序
# print(df2)

#指定列序与索引
# df3=pd.DataFrame(data,columns=["name","year","sex","city"],index=["a","b","c","d","e"]) #指定列名顺序
# print(df3)

#上面演示的是字典创建DataFrame数据
#下面从其它数据类型来创建DataFrame数据

#用numpy的矩阵数据来创建pd的DataFrame数据,不指定列的话,列名与索引一样,
# np1=np.arange(0,12).reshape(4,3)
# print(np1)
# df4=pd.DataFrame(np1)
# print(df4)
# df5=pd.DataFrame(np1,columns=["一","二","三"]) #指定列名
# print(df5)

#用pd的Series数据来创建DataFrame,也是可以的,不过只有一列数据,因Series是一维的
# objs1=pd.Series(["name","year","sex","city"])
# print(objs1)
# df6=pd.DataFrame(objs1)
# print(df6)

#通过列表元组来创建DataFrame数据,结果与pd.Series的结果一样,因都是一维数组
# ll=["namel","yearl","sexl","cityl"]
# tt=("namet","yeart","sext","cityt")
# df7l=pd.DataFrame(ll)
# df8t=pd.DataFrame(tt)
# print(df7l)
# print("_________")
# print(df8t)

#设置name属性,注:列可以通过df9["列名"]访问,也可通过df9.列名 访问与设置
# df9=pd.DataFrame(data)
# print(df9)
# df9.index.name="id"
# df9.columns.name="gogo"
# print("________________")
# print(df9)
# print(df9.values)
# print(df9.keys())

原文地址:https://www.cnblogs.com/yiyea/p/11441789.html

时间: 2024-11-02 09:53:11

Pandas库02_DataFrame数据结构的相关文章

Pandas库06_DataFrame数据结构_汇总与统计

#这里讲演pandas的汇总与统计import numpy as npimport pandas as pd #我自己的私有函数库,我都加了t_+函数名的t_data={ "name":["唐浩","小王","老王","赵三","李四","王姐"], "sex":["男","女","男",

Pandas库05_DataFrame数据结构_运算

import pandas as pdimport numpy as np# data={# "name":["唐浩","小王","老王","赵三","李四"],# "sex":["男","女","男","女","男"],# "year":[37,2

Pandas库04_DataFrame数据结构_索引与选取

import pandas as pd data={ "name":["唐浩","小王","老王","赵三","李四"], "sex":["男","女","男","女","男"], "year":[37,22,15,18,33], "cit

Python的Pandas库简述

pandas 是 python 的数据分析处理库import pandas as pd 1.读取CSV.TXT文件 foodinfo = pd.read_csv("pandas_study.csv", encoding = "utf-8") 2.查看前N条.后N条信息 foodinfo.head(N) foodinfo.tail(N) 3.查看数据框的格式,是DataFrame还是ndarray print(type(foodinfo)) # 结果:<clas

Pandas库中的DataFrame

1 简介 DataFrame是Python中Pandas库中的一种数据结构,它类似excel,是一种二维表. 或许说它可能有点像matlab的矩阵,但是matlab的矩阵只能放数值型值(当然matlab也可以用cell存放多类型数据),DataFrame的单元格可以存放数值.字符串等,这和excel表很像. 同时DataFrame可以设置列名columns与行名index,可以通过像matlab一样通过位置获取数据也可以通过列名和行名定位,具体方法在后面细说. 2 创建DataFrame 首先声

pandas库的DateFrame类型

Series是pandas库的一维数据类型,DateFrame是pandas库的二维数据类型. DateFrame类型: DateFrame类型由共用相同索引的一组列组成(DateFrame相当于一个表格),每列值类型可以不同. DateFrame既有行索引,也有列索引. DateFrame常用于表达二维数据,但可以表达多维数据. DateFrame类型可以由如下类型创建: 1.二维ndarray对象 import pandas as pd import numpy as np d = pd.D

python之pandas库

一.生成数据表 1.首先导入pandas库,一般都会用到numpy库,所以我们先导入备用: import pandas as pd 2.导入CSV或者xlsx文件: df = pd.DataFrame(pd.read_csv('name.csv',header=1)) df = pd.DataFrame(pd.read_excel('name.xlsx')) 3.用pandas创建数据表: df = pd.DataFrame({"id":[1001,1002,1003,1004,100

Python Pandas库的学习(三)

今天我们来继续讲解Python中的Pandas库的基本用法 那么我们如何使用pandas对数据进行排序操作呢? food.sort_values("Sodium_(mg)",inplace= True) print(food["Sodium_(mg)"]) food.sort_values("Sodium_(mg)",inplace=True,ascending= False) print(food["Sodium_(mg)"

Python学习教程(Python学习路线):Pandas库基础分析-详解时间序列的处理

Python学习教程(Python学习路线):Pandas库基础分析-详解时间序列的处理 在使用Python进行数据分析时,经常会遇到时间日期格式处理和转换,特别是分析和挖掘与时间相关的数据,比如量化交易就是从历史数据中寻找股价的变化规律.Python中自带的处理时间的模块有datetime,NumPy库也提供了相应的方法,Pandas作为Python环境下的数据分析库,更是提供了强大的日期数据处理的功能,是处理时间序列的利器. 1.生成日期序列 主要提供pd.data_range()和pd.p