1 创建多层索引
1)隐式构造
最常见的方法是给DataFrame构造函数的index参数传递两个或更多的数组
· Series也可以创建多层索引
一般情况下,两层索引就够用了
2)显式构造 pd.MultiIndex
· 使用数组
· 使用tuple
· 使用product 最简单,推荐使用
2 对DataFrame列同样可以设置多层索引
============================
练习8:
1 创建一个DataFrame,表示张三、李四期中、期末各科成绩。
============================
3 多层索引对象的索引与切片操作
1)Series的操作
【重要】对于Series来说,直接中括号[]与使用.loc()完全一样,因此,推荐使用中括号索引和切片。
(1)索引
#第一个参数相当于多层索引的第一维,第二个参数就是第二维了
#把两个参数写在一起,会将整体作为一个参数,就把整体中的所有的参数都作为一维参数,能查到的就返回,查不到的就不返回,一维中没有期中,所以只返回了张三的查询结果,看看那下面这张截图就知道怎么回事了。
(2)切片
2)DataFrame的操作
(1)可以直接使用列名来进行索引
(2)使用行索引需要用ix(),loc()等函数
【及其重要】推荐使用loc()函数
注意在对行索引的时候,若一级行索引还有多个,对二级行索引会遇到问题!也就是说,无法直接对二级索引进行索引,必须让二级索引变成一级索引后才能对其进行索引!
同时对一二级索引进行检索
===============================
练习:
1 分析比较Series和DataFrame各种索引的方式,熟练掌握.loc()方法
2 假设张三再一次在其中考试的时候因为特殊原因放弃Python考试,如何实现
===============================
4 索引的堆(先入后出)(stack)
· stack()
· unstack()
【小技巧】使用stack()的时候,level等于哪一个,哪一个就消失,出现在行里。
【小技巧】使用unstack()的时候,level等于哪一个,哪一个就消失,出现在列里。
==========================================
练习:
1,使用unstack()将ddd变成两行,分别为期中期末
2,使用unstack()将ddd变成四行,分别为四个科目
==========================================
5 聚合操作
【注意】
· 需要指定axis
· 【小技巧】和unstack()相反,聚合的时候,axis等于哪一个,哪一个就保留。
所谓的聚合操作:平均数,方差,最大值,最小值 ......
=======================================
练习:
1 计算各个科目中期末平均成绩
2 计算各个科目张三李四的最高分
原文地址:https://www.cnblogs.com/avention/p/9086539.html