Pandas库06_DataFrame数据结构_汇总与统计

#这里讲演pandas的汇总与统计
import numpy as np
import pandas as pd

#我自己的私有函数库,我都加了t_+函数名的
t_data={
"name":["唐浩","小王","老王","赵三","李四","王姐"],
"sex":["男","女","男","女","男","女"],
"year":[37,22,15,18,33,25],
"city":["成都","北京","上海","成都","深圳","北京"]
}

df1=pd.DataFrame(np.arange(0,20).reshape(5,4),index=[1,2,3,4,5],columns=["A","B","C","D"])
print(df1)

#列求和
# df2=df1.sum(axis=1) #x轴进行行求和
# print(df2)
# df22=df1.sum(axis=0) # 默认,y轴列求和
# print(df22)

#describe方法,很有用,对所有数值型列进行统计
#eg :
df222=df1.describe() #只能是列,行无效,无 axis选项
print(df222)
df2222=df222.applymap(lambda x:"%.2f"%x)
print(df2222)
#下面这个是什么意思
print(df2222.index) #Index([‘count个数‘, ‘mean平均值‘, ‘std‘, ‘min‘, ‘25%‘, ‘50%‘, ‘75%‘, ‘max‘]
#所以要拿到A列的个数,平均值,最大值,最小值,std...
# print(df222.ix["min","D"]) #想拿什么就是什么,这个要报警,那就下面这种方法了
print(df222["D"]["max"]) #df222["列名即key"]["索引标签"]这样同样能拿到我想要的
print(df2222["A"]["mean"])
"""
A B C D
count 5.00 5.00 5.00 5.00
mean 8.00 9.00 10.00 11.00
std 6.32 6.32 6.32 6.32
min 0.00 1.00 2.00 3.00
25% 4.00 5.00 6.00 7.00
50% 8.00 9.00 10.00 11.00
75% 12.00 13.00 14.00 15.00
max 16.00 17.00 18.00 19.00
"""

#列元素个数,行数
# df3=len(df1.index)
# print(df3)
# print(df1.index) #获得索引的列表

#求列数,像字典中key个数
# df4=len(df1.keys())
# print(df4)
# print(df1.keys()) #获得列名的列表
# print(df1.values) #Series数据类型,所有的值元素的矩阵

#所有总的元素个数就是索引数X列数
# print(len(df1.keys())*len(df1.index))

原文地址:https://www.cnblogs.com/yiyea/p/11441803.html

时间: 2024-11-09 12:34:36

Pandas库06_DataFrame数据结构_汇总与统计的相关文章

Pandas库05_DataFrame数据结构_运算

import pandas as pdimport numpy as np# data={# "name":["唐浩","小王","老王","赵三","李四"],# "sex":["男","女","男","女","男"],# "year":[37,2

Pandas库04_DataFrame数据结构_索引与选取

import pandas as pd data={ "name":["唐浩","小王","老王","赵三","李四"], "sex":["男","女","男","女","男"], "year":[37,22,15,18,33], "cit

Pandas库02_DataFrame数据结构

#DataFrame数据结构,很像二维表格数据结构,也是python中最常用的数据结构 import pandas as pdimport numpy as np #创建DataFrame数据#先给出一个字典data,我们用字典来创建data={ "name":["唐浩","小王","老王","赵三","李四"], "sex":["男","

python之pandas库

一.生成数据表 1.首先导入pandas库,一般都会用到numpy库,所以我们先导入备用: import pandas as pd 2.导入CSV或者xlsx文件: df = pd.DataFrame(pd.read_csv('name.csv',header=1)) df = pd.DataFrame(pd.read_excel('name.xlsx')) 3.用pandas创建数据表: df = pd.DataFrame({"id":[1001,1002,1003,1004,100

Python学习教程(Python学习路线):Pandas库基础分析-详解时间序列的处理

Python学习教程(Python学习路线):Pandas库基础分析-详解时间序列的处理 在使用Python进行数据分析时,经常会遇到时间日期格式处理和转换,特别是分析和挖掘与时间相关的数据,比如量化交易就是从历史数据中寻找股价的变化规律.Python中自带的处理时间的模块有datetime,NumPy库也提供了相应的方法,Pandas作为Python环境下的数据分析库,更是提供了强大的日期数据处理的功能,是处理时间序列的利器. 1.生成日期序列 主要提供pd.data_range()和pd.p

Python的Pandas库简述

pandas 是 python 的数据分析处理库import pandas as pd 1.读取CSV.TXT文件 foodinfo = pd.read_csv("pandas_study.csv", encoding = "utf-8") 2.查看前N条.后N条信息 foodinfo.head(N) foodinfo.tail(N) 3.查看数据框的格式,是DataFrame还是ndarray print(type(foodinfo)) # 结果:<clas

Pandas库中的DataFrame

1 简介 DataFrame是Python中Pandas库中的一种数据结构,它类似excel,是一种二维表. 或许说它可能有点像matlab的矩阵,但是matlab的矩阵只能放数值型值(当然matlab也可以用cell存放多类型数据),DataFrame的单元格可以存放数值.字符串等,这和excel表很像. 同时DataFrame可以设置列名columns与行名index,可以通过像matlab一样通过位置获取数据也可以通过列名和行名定位,具体方法在后面细说. 2 创建DataFrame 首先声

Python Pandas库的学习(三)

今天我们来继续讲解Python中的Pandas库的基本用法 那么我们如何使用pandas对数据进行排序操作呢? food.sort_values("Sodium_(mg)",inplace= True) print(food["Sodium_(mg)"]) food.sort_values("Sodium_(mg)",inplace=True,ascending= False) print(food["Sodium_(mg)"

数据结构_课程设计——最小生成树:室内布线

***************************************转载请注明出处:http://blog.csdn.net/lttree******************************************** 这道课程设计,费不少时间,太麻烦了= =.(明明是能力不够) ~~~~最小生成树:室内布线~~~~ 题目要求: 装修新房子是一项颇为复杂的工程,现在需要写个程序帮助房主设计室内电线的布局. 首先,墙壁上插座的位置是固定的.插座间需要有电线相连,而且要布置的整齐美