python系统学习:第五周之数据分析1

# 打开文件path = ‘D:\\操作软件\\pydata-book-2nd-edition\\pydata-book-2nd-edition\\datasets\\bitly_usagov\\example.txt‘# json格式处理import json

records = [json.loads(line) for line in open(path)]# 校验 print(records[0])# tz时区计数from pandas import DataFrame, Seriesimport pandas as pdimport numpy as np

# 处理frame = DataFrame(records)cframe = frame[‘tz‘].fillna(‘MISS‘)cframe[cframe == ‘‘] == ‘KONG‘tz_count = cframe.value_counts()# 校验 print(tz_count[:20])# 画图import matplotlib as mplimport pylab as pl

# 参数设定tz_count[:20].plot(kind=‘barh‘, rot=20)pl.xlabel(u‘count‘)pl.ylabel(u‘type‘)pl.title(u‘tz_count‘)# 校验 pl.show()# 查看浏览器类型 print(records[0])result = Series([x.split()[0] for x in frame.a.dropna()])# print(result[:20])liu_count = result.value_counts()# 校验 print(liu_count[:20])# 再次分组查看:是否是win print(records[0])frame = DataFrame(records)gframe = frame[frame.a.notnull()]# 找出分组字段by_column = np.where(gframe[‘a‘].str.contains(‘Windows‘),‘Windows‘,‘Not Windows‘)# 分组明细by_detail = gframe.groupby([‘tz‘, by_column])# 分组计数by_count = by_detail.size().unstack().fillna(0)print(by_count[:20])

原文地址:https://www.cnblogs.com/niushichong/p/10331219.html

时间: 2024-11-05 11:19:36

python系统学习:第五周之数据分析1的相关文章

Python入门学习第五周:字符串·作业

python学习第五周字符串相关学习内容总结与作业 第五周主要是对字符串相关操作的学习包括 字符串的定义字符的序列 基本字符运算 求长度len(str)函数 拼接+str = str1 + 'pinjie' 重复*name * 3 就是把name的字符串内容输出三次 成员运算in判断一个字符串是否是另一个字符串的子串 for语句 枚举字符串中的每个字符 字符串索引每个字符串都有一个索引值索引从0前向或-1后向开始索引运算符[] 切片操作选择字符串的子序列语法 [start : finish] s

201671010140. 2016-2017-2 《Java程序设计》java学习第五周

java学习第五周心得体会        本周,是Java学习第五周,随着时间推移,随着课本内容的推进,我们接触到的程序也开始变得越来越复杂,不再是二三章那些用来练手的小程序了,这一点,在我们的例题运行注解上就可以感受到,程序的长度,涉及到的知识越来越多.        本周学习主要关注超类与子类的关系--继承,继承是面向对象最显著的一个特性,从已有的类(超类)中派生出新的类(子类),新的类能继承已有类的数据属性和行为,并能扩展新的能力. Java继承是使用已存在的类的定义作为基础建立新类的技术

【python系统学习07】一张图看懂字典并学会操作

点击跳转 - 原文地址 数据类型 - 字典(dict) 目录: [python系统学习07]一张图看懂字典并学会操作 原文地址:https://www.cnblogs.com/padding1015/p/12232571.html

python dlib学习(五):比对人脸

前言在前面的博客中介绍了,如何使用dlib标定人脸(python dlib学习(一):人脸检测),提取68个特征点(python dlib学习(二):人脸特征点标定).这次要在这两个工作的基础之上,将人脸的信息提取成一个128维的向量空间.在这个向量空间上,同一个人脸的更接近,不同人脸的距离更远.度量采用欧式距离,欧氏距离计算不算复杂.二维情况下:distance=(x1−x2)2+(y1−y2)2−−−−−−−−−−−−−−−−−−√distance=(x1−x2)2+(y1−y2)2 三维情

python学习--第五周

本节大纲: 模块介绍 time &datetime模块 random os sys shutil json & picle shelve xml处理 yaml处理 configparser hashlib subprocess logging模块 re正则表达式 模块,用一砣代码实现了某个功能的代码集合. 类似于函数式编程和面向过程编程,函数式编程则完成一个功能,其他代码用来调用即可,提供了代码的重用性和代码间的耦合.而对于一个复杂的功能来,可能需要多个函数才能完成(函数又可以在不同的.p

python系统学习:第三周之文件操作

# ***********第一部分***********# 1.读文件,首先利用一个变量承装文件 最主要注意的是encoding的问题,看看是否是格式问题f = open(file='D:\study\少妇白洁.txt', mode='r', encoding='GBK') # file等关键字可以直接省略 mode 指模式# 对变量使用方法read进行读取data = f.read()# 输出print(data)# 关闭f.close()# ***********第二部分**********

python系统学习:第三周之简单的三级菜单

# 三级目录info = { # 一级 'ShanXi': { # 二级 'JieXiu': { # 三级 'XiaoSongQv': ['Burn here!'], 'SanSchool': ['Study here'] } }, 'BeiJing': { 'ChaoYang': { 'XianNinghou': ['Live here!'] }, 'BeiYuan': { 'TieJian': ['Work Here!'] } }}# 三级目录的跳转# 定义标志flag = Falsewhi

20145234黄斐《信息安全系统升级系统》第五周学习总结

教材内容概述 3.1 历史观点 X86 寻址方式经历三代: 1 DOS时代的平坦模式,不区分用户空间和内核空间,很不安全2 8086的分段模式3 IA32的带保护模式的平坦模式 3.2 程序编码 计算机系统使用了多种不同的抽象,对机器级编程来说,两种抽象尤为重要: 机器级程序的格式和行为,定义为"指令集体系结构"--"ISA" 机器级程序使用的存储器地址是虚拟地址 可见的处理器状态 程序计数器 指示将要执行的下一条指令在存储器中的位置 整数寄存器文件包含8个命名的位

python系统学习:第三周之嵌套函数

# 这个例子说明如果函数中没有直接定义某变量,则他会向父级寻找,优先级:自己-父级-爷爷级···name = "niu"def guess(): print(">>NO.1", name)guess() # 输出"niu" # 嵌套函数(函数当中包含函数)name2 = "shi"def guess2(): name2 = "chong" print(">>NO.2.1&q