pandas dataframe 操作技巧 总结

#中文myfont = FontProperties(fname=r‘C:\Windows\Fonts\simhei.ttf‘, size=14)import seaborn as snssns.set(font=myfont.get_name())

file = open(".xlsx", "rb")data = pd.read_excel(file, sep="\t")data = data.loc[(data[‘时间‘] > 0) & (data[‘时间‘] < 4320)]drop_feat = ["编号",..., "状态"]feat = [i for i in data.columns if i not in drop_feat]data = data[feat]print(data.isnull().sum() / len(data)) #看缺失比例,字段

# 读取文档以及,过滤填充数据, 筛选数据
# ddie = data.loc[(data[‘等级‘] == "Ⅲ") | (data[‘等级‘] == "Ⅳ")]
data = ddie.groupby([‘时段‘, ‘分类‘]).mean().reset_index()dataForsize = ddie.groupby([‘时段‘, ‘分类‘]).size().reset_index()  

dmean1 = data.loc[(data[‘类‘] == ‘‘) | (data[‘‘] == ‘‘)]dsize1 = dataForsize.loc[(dataForsize[‘类‘] == ‘统‘) | (dataForsize[‘‘] == ‘‘)]dmean1 = dmean1.groupby([‘挂‘]).mean()  #  分组后 平均dsize1 = dsize1.groupby([‘挂‘])[0].agg(sum)  # 计  分组后 求和

# xx = list(range(0, 24))  技巧得 x轴 连续坐标y1 = dmean1["时间"]x1 = y1._index._data  技巧 对应的 索引 不连续坐标 ,  方法论:debug查 属性

plt.figure(figsize=(16,5))plt.plot(x1, y1,color=‘blue‘)plt.plot(x3, y3,color=‘red‘)for i, (_x, _y) in enumerate(zip(x1, y1)):    plt.text(_x, _y, dsize1[x1[i]], color=‘blue‘, fontsize=12) # 关键 dsize1[x1[i]]  是从连续的i找不连续的x[i]的坐标来得到不连续的y值
plt.xticks(np.arange(24))label = [ "其它"]plt.legend(label, loc=0, ncol=2)plt.xlabel("  0-23小时")plt.ylabel("时长")plt.show()

原文地址:https://www.cnblogs.com/-aye/p/8984484.html

时间: 2024-11-13 10:38:42

pandas dataframe 操作技巧 总结的相关文章

Dataframe操作时出现 KeyError: &#39;列名xxx&#39;

python确实很用来很爽很苏服,代码不多 各种库出于易用目的,做了很多默认设置,但要是不认真看API,那就会掉到坑里了. df1.groupby(['Dn','UserLabel','BeginTime']).first() df1['city']=df1['UserLabel'].str.slice(0,2) 出现 df1['UserLabel'] File "D:\script\Python279\lib\site-packages\pandas\core\frame.py",

Python pandas.DataFrame调整列顺序及修改index名

1. 从字典创建DataFrame >>> import pandas >>> dict_a = {'user_id':['webbang','webbang','webbang'],'book_id':['3713327','4074636','26873486'],'rating':['4','4','4'],'mark_date':['2017-03-07','2017-03-07','2017-03-07']} >>> df = pandas.

Python:23种Pandas核心操作

Pandas 是一个 Python 软件库,它提供了大量能使我们快速便捷地处理数据的函数和方法.一般而言,Pandas 是使 Python 成为强大而高效的数据分析环境的重要因素之一.在本文中,作者从基本数据集读写.数据处理和 DataFrame 操作三个角度展示了 23 个 Pandas 核心方法. Pandas 是基于 NumPy 构建的库,在数据处理方面可以把它理解为 NumPy 加强版,同时 Pandas 也是一项开源项目.它基于 Cython,因此读取与处理数据非常快,并且还能轻松处理

PPT快捷键与操作技巧

PPT操作技巧 Ctrl+鼠标滚轮:缩放页面大小. Ctrl+鼠标左键:按住ctrl键,用鼠标左键拖动,快速复制. Ctrl+方向键:微调. Ctrl+放大缩小操作:按住ctrl键进行放大和缩小时以对象中心进行调节. Ctrl+D:快捷复制. Ctrl+]:增大字体. Ctrl+[减小字体. Ctrl+G:组合. Ctrl+shift+G:取消组合. 抠图: 双击图片->删除图片背景 虚化: 艺术效果->毛玻璃,虚化半径 重设图片:恢复原状 母版: 视图->幻灯片母版.在母版中插入素材,

pandas.DataFrame.plot

pandas.DataFrame.plot¶ DataFrame.plot(x=None, y=None, kind='line', ax=None, subplots=False, sharex=None, sharey=False, layout=None, figsize=None, use_index=True, title=None, grid=None, legend=True, style=None, logx=False, logy=False, loglog=False, xt

Android Studio常用操作技巧

这段时间一直在用Android Studio做一些Demo的开发,一开始从Eclipse中转向这个开发工具,各种不适应,希望此博文可以一直更新,还有网友可以分享出自己方便更好更快开发的一些技巧. 首先我讲一些经常用到的快捷键吧,网上很多都只说一个大概,很模糊,也不知道什么时候才会用到.我们尽量让这篇博文有作用而不是纯粹的Copy吧! 虽然说Android Studio可以直接一键把所有快捷键设置成Eclipse的快捷键,但是想到你身边的同事,有可能不一定会设置成Eclipse,这样有的时候你如果

vi 操作技巧

输入模式的操作Home光标到行首End 光标到行尾Page Up和Page Down上下翻页Delect删除光标位置的字符删除操作(命令模式使用)x删除光标处的单个字符dd删除光标所在行dw删除当前字符到单词尾包括空格的所有字符#x例如3x删除光标处向右的三个字符#dd例如3dd从当前行开始向下删除三行文本撤销操作u命令取消最近一次的操作,可以使用多次来恢复原有的操作U取消所有操作Ctrl+R可以恢复对使用u命令的操作复制操作yy命令复制当前整行的内容到vi缓冲区yw复制当前光标所在位置到单词尾

Python字典增删操作技巧简述

Python编程语言是一款比较容易学习的计算机通用型语言.对于初学者来说,首先需要掌握的就是其中的一些基础应用.比如今天我们为大家介绍的Python字典的相关操作,就是我们在学习过程中需要熟练掌握的技巧. Python字典(Dictionary)是一种映射结构的数据类型,由无序的“键-值对”组成.字典的键必须是不可改变的类型,如:字符串,数字,tuple:值可以为任何Python数据类型. 1.新建Python字典 >>> dict = {} #新建一个空字典 >>>

邮币卡怎么操作?邮币卡操作技巧?

[color=#333333]这个需要你首先实名制申请一个账户,然后办一张带有网银的建行,在银行官网签约绑定之后,入金激活就可以买卖了,买卖在交易软件上操作.非常简单.风险比起其他的投资方式不算大,他类似于股票但是交易机制比股票在灵活一些,是t+0的当天就可以买卖,而且邮票自身就是有价值的,属于保值增值的一种投资方式.况且现在大多数票都是涨的,我们又有专业的分析师团队负责分析这些票,自然降低了很多风险.就算是买的票暂时跌了我们也可以先持有,等它上涨咱们在卖出.任何投资又赚钱的有赔钱的,还得看你自