python系统学习：第五周之数据分析1

# 打开文件path = ‘D:\\操作软件\\pydata-book-2nd-edition\\pydata-book-2nd-edition\\datasets\\bitly_usagov\\example.txt‘# json格式处理import json

records = [json.loads(line) for line in open(path)]# 校验 print(records[0])# tz时区计数from pandas import DataFrame, Seriesimport pandas as pdimport numpy as np

# 处理frame = DataFrame(records)cframe = frame[‘tz‘].fillna(‘MISS‘)cframe[cframe == ‘‘] == ‘KONG‘tz_count = cframe.value_counts()# 校验 print(tz_count[:20])# 画图import matplotlib as mplimport pylab as pl

# 参数设定tz_count[:20].plot(kind=‘barh‘, rot=20)pl.xlabel(u‘count‘)pl.ylabel(u‘type‘)pl.title(u‘tz_count‘)# 校验 pl.show()# 查看浏览器类型 print(records[0])result = Series([x.split()[0] for x in frame.a.dropna()])# print(result[:20])liu_count = result.value_counts()# 校验 print(liu_count[:20])# 再次分组查看：是否是win print(records[0])frame = DataFrame(records)gframe = frame[frame.a.notnull()]# 找出分组字段by_column = np.where(gframe[‘a‘].str.contains(‘Windows‘),‘Windows‘,‘Not Windows‘)# 分组明细by_detail = gframe.groupby([‘tz‘, by_column])# 分组计数by_count = by_detail.size().unstack().fillna(0)print(by_count[:20])

原文地址：https://www.cnblogs.com/niushichong/p/10331219.html

时间： 2024-11-05 11:19:36

python系统学习：第五周之数据分析1的相关文章

Python入门学习第五周：字符串·作业

python学习第五周字符串相关学习内容总结与作业第五周主要是对字符串相关操作的学习包括字符串的定义字符的序列基本字符运算求长度len(str)函数拼接+str = str1 + 'pinjie' 重复*name * 3 就是把name的字符串内容输出三次成员运算in判断一个字符串是否是另一个字符串的子串 for语句枚举字符串中的每个字符字符串索引每个字符串都有一个索引值索引从0前向或-1后向开始索引运算符[] 切片操作选择字符串的子序列语法 [start : finish] s

201671010140. 2016-2017-2 《Java程序设计》java学习第五周

java学习第五周心得体会本周,是Java学习第五周,随着时间推移,随着课本内容的推进,我们接触到的程序也开始变得越来越复杂,不再是二三章那些用来练手的小程序了,这一点,在我们的例题运行注解上就可以感受到,程序的长度,涉及到的知识越来越多. 本周学习主要关注超类与子类的关系--继承,继承是面向对象最显著的一个特性,从已有的类(超类)中派生出新的类(子类),新的类能继承已有类的数据属性和行为,并能扩展新的能力. Java继承是使用已存在的类的定义作为基础建立新类的技术

【python系统学习07】一张图看懂字典并学会操作

点击跳转 - 原文地址数据类型 - 字典(dict) 目录: [python系统学习07]一张图看懂字典并学会操作原文地址:https://www.cnblogs.com/padding1015/p/12232571.html

python dlib学习（五）：比对人脸

前言在前面的博客中介绍了,如何使用dlib标定人脸(python dlib学习(一):人脸检测),提取68个特征点(python dlib学习(二):人脸特征点标定).这次要在这两个工作的基础之上,将人脸的信息提取成一个128维的向量空间.在这个向量空间上,同一个人脸的更接近,不同人脸的距离更远.度量采用欧式距离,欧氏距离计算不算复杂.二维情况下:distance=(x1−x2)2+(y1−y2)2−−−−−−−−−−−−−−−−−−√distance=(x1−x2)2+(y1−y2)2 三维情

python学习--第五周

本节大纲: 模块介绍 time &datetime模块 random os sys shutil json & picle shelve xml处理 yaml处理 configparser hashlib subprocess logging模块 re正则表达式模块,用一砣代码实现了某个功能的代码集合. 类似于函数式编程和面向过程编程,函数式编程则完成一个功能,其他代码用来调用即可,提供了代码的重用性和代码间的耦合.而对于一个复杂的功能来,可能需要多个函数才能完成(函数又可以在不同的.p

python系统学习：第三周之文件操作

# ***********第一部分***********# 1.读文件,首先利用一个变量承装文件最主要注意的是encoding的问题,看看是否是格式问题f = open(file='D:\study\少妇白洁.txt', mode='r', encoding='GBK') # file等关键字可以直接省略 mode 指模式# 对变量使用方法read进行读取data = f.read()# 输出print(data)# 关闭f.close()# ***********第二部分**********

python系统学习：第三周之简单的三级菜单

# 三级目录info = { # 一级 'ShanXi': { # 二级 'JieXiu': { # 三级 'XiaoSongQv': ['Burn here!'], 'SanSchool': ['Study here'] } }, 'BeiJing': { 'ChaoYang': { 'XianNinghou': ['Live here!'] }, 'BeiYuan': { 'TieJian': ['Work Here!'] } }}# 三级目录的跳转# 定义标志flag = Falsewhi

20145234黄斐《信息安全系统升级系统》第五周学习总结

教材内容概述 3.1 历史观点 X86 寻址方式经历三代: 1 DOS时代的平坦模式,不区分用户空间和内核空间,很不安全2 8086的分段模式3 IA32的带保护模式的平坦模式 3.2 程序编码计算机系统使用了多种不同的抽象,对机器级编程来说,两种抽象尤为重要: 机器级程序的格式和行为,定义为"指令集体系结构"--"ISA" 机器级程序使用的存储器地址是虚拟地址可见的处理器状态程序计数器指示将要执行的下一条指令在存储器中的位置整数寄存器文件包含8个命名的位

python系统学习：第三周之嵌套函数

# 这个例子说明如果函数中没有直接定义某变量,则他会向父级寻找,优先级:自己-父级-爷爷级···name = "niu"def guess(): print(">>NO.1", name)guess() # 输出"niu" # 嵌套函数(函数当中包含函数)name2 = "shi"def guess2(): name2 = "chong" print(">>NO.2.1&q