pandas、matplotlib

import requests,re,pandas

from fake_useragent import UserAgent

url = ‘http://www.laoyuegou.com/x/zh-cn/lol/lol/godrank.html?region=cn&area=1‘

x=‘.{1,600}?‘;y=‘([一-龥]+)‘

pattern=re.compile(f‘item1">(#\d+){x}server">{y}{x}em>(\d+){x}span>(\d+){x}span\

>(\d+){x}age">({x}%){x}score/({x}).png{x}dan">({x})<{x}"{y}"{x}"{y}"{x}"{y}"‘, re.S)

def downLoad():

r=requests.get(url,headers={‘User-Agent‘:UserAgent().random}).text

area=re.findall(‘cn-li.*?(http.*?)".*?([一-龥]{2,9})‘,r,re.S)

for region in area:

players = []

for page in range(1,5):

h = {‘User-Agent‘: UserAgent().random}

r=requests.get(region[0]+f‘&page={page}‘,headers=h).text

print(‘下载%s战区的第%s页‘ %(region[1],page))

#同类型之间才能用+;字串转tuple,除了套(),还要加逗号,如(s,)

# [players.append((region[1],)+x) for x in pattern.findall(r)]

players.extend(pattern.findall(r))

pandas.DataFrame(players).to_csv(‘LOL.csv‘,header=False,index=False,mode=‘a+‘)

# downLoad()

***************分割线***************

import pandas

import matplotlib as mpl

import matplotlib.pyplot as plt

mpl.rcParams[‘font.sans-serif‘]=[‘simhei‘]    #配置字体,msyh等字体不能展示中文

plt.rcParams[‘axes.labelsize‘]=16   #配置绘图风格

plt.rcParams[‘xtick.labelsize‘] = 14

plt.rcParams[‘ytick.labelsize‘] = 14

plt.rcParams[‘legend.fontsize‘] = 12

plt.rcParams[‘figure.figsize‘] = [15,6]

plt.rcParams[‘axes.unicode_minus‘] = False

data=pandas.read_csv(‘E:\py\\LOL.csv‘,encoding=‘gbk‘)  #文件路径中不能有中文

# print(data[50:60])  #输出哪些行

# print(data.head(7))  #head()和tail(),不写数字时,默认取5条记录

# print(data.ix[0:4,[‘排名‘,‘本命英雄1‘]])  #罕见的输出行包含end

# print(data.describe())  #int类型的那些列的8条统计信息

# data[‘位置‘].value_counts().drop(‘--‘).plot(kind=‘bar‘,rot=45,color=‘r‘)  #kind图表型,rot轴标题

pandas.concat([data[‘本命英雄1‘][:7],data[‘本命英雄2‘][:7],data[‘本命英雄3‘][:7]])\

.value_counts().plot(kind=‘barh‘,rot=0,color=‘y‘)

plt.show()

****************************************分割线****************************************

666

时间: 2024-10-05 04:29:32

pandas、matplotlib的相关文章

python2.7安装numpy、pandas、matplotlib库

我装的是python2.7 然后pip的版本是18.1,最近使用pip install **安装包的时候总是会提示 You are using pip version 18.1, however version 19.1.1 is available. 可以在python安装目录的Scripts文件夹下打开powershell,然后通过指令 easy_install.exe pip==19.1.1 更新到提示的pip最新版本 更新成功后,再次查看pip版本,已经是最新的19.1.1了 安装num

numpy、pandas、matplotlib的用法

一. 数组要比列表效率高很多 numpy高效的处理数据,提供数组的支持,python默认没有数组.pandas.scipy.matplotlib都依赖numpy. pandas主要用于数据挖掘,探索,分析 maiplotlib用于作图,可视化 scipy进行数值计算,如:积分,傅里叶变换,微积分 statsmodels用于统计分析 Gensim用于文本挖掘 sklearn机器学习, keras深度学习 二. numpy和mkl 下载安装 pandas和maiplotlib网络安装 scipy 下

Windows764位+python35下依赖包的安装方法(numpy、pandas、matplotlib等)

1.在http://www.lfd.uci.edu/~gohlke/pythonlibs/#mysql-python下载需要的依赖包的对应版本: 例如我的python版本是python3.5,要下载numpy依赖包的对应版本为numpy-1.11.1+mkl-cp35-cp35m-win_amd64.whl,cp35-cp35m是对应python3.5版本,win_amd64对应windows下的64位系统. 2.将下载好的依赖包保存到python安装文件夹中的的Scripts文件夹中,我的路径

ML numpy、pandas、matplotlib的使用

1. 利用公式  x^2 + y^2 < 1,画一个圆: import numpy as np import matplotlib.pyplot as plt data = 2*np.random.rand(10000, 2)-1 # 在-1到1之间显示 print(data) x = data[:, 0] y = data[:, 1] # 显示圆形 x^2 + y^2 < 1 其中idx中满足的点即为true,不满足的点为false idx = x**2 + y**2 < 1.000

使用easy_install安装numpy、pandas、matplotlib及各种第三方模块

倒腾了一晚上终于把题目中的环境配好了.下面简要说明,留作资料,并共享. 1.安装python.在cmd中能进入python环境,通过把python路径添加到系统路径中即可实现. 2.安装easy-install(也就是installtools).到官网上下载合适版本的压缩包解压之后,使用cmd进入到解压目录中,使用python setup.py install就能安装. 3.这个时候import你想使用的模块,如果提示该模块不存在,有两个方案:一是下载该模块的压缩包解压同(2)的安装方法.这个时

【Python数据挖掘课程】六.Numpy、Pandas和Matplotlib包基础知识

前面几篇文章采用的案例的方法进行介绍的,这篇文章主要介绍Python常用的扩展包,同时结合数据挖掘相关知识介绍该包具体的用法,主要介绍Numpy.Pandas和Matplotlib三个包.目录:        一.Python常用扩展包        二.Numpy科学计算包        三.Pandas数据分析包        四.Matplotlib绘图包 前文推荐:       [Python数据挖掘课程]一.安装Python及爬虫入门介绍       [Python数据挖掘课程]二.K

Pandas与Matplotlib基础

pandas是Python中开源的,高性能的用于数据分析的库.其中包含了很多可用的数据结构及功能,各种结构支持相互转换,并且支持读取.保存数据.结合matplotlib库,可以将数据已图表的形式可视化,反映出数据的各项特征. 先借用一张图来描述一下pandas的一些基本使用方法,下面会通过一些实例对这些知识点进行应用. 一.安装pandas库 pandas库不属于Python自带的库,所以需要单独下载,如果已经安装了Python,可以使用pip工具下载pandas: pip install pa

windows下python配置numpy、matplotlib、scipy

这两天对Python进行了研究,并且配置了numpy.matplotlib以及scipy.现对基本概念以及配置步骤介绍: 基本概念: Python (英语发音:/?pa?θ?n/), 是一种面向对象.解释型计算机程序设计语言.专用的科学计算扩展库很多,例如如下3个十分经典的科学计算扩展库:NumPy.SciPy和matplotlib,它们分别为Python提供了快速数组处理.数值运算以及绘图功能. <python科学计算>这本书中对Python介绍得很是详细,推荐下.电子版下载链接http:/

Numpy、SciPy、MatPlotLib在Python2.7.9下的安装与配置

前言: 2015年10月底开始入手学习Python,一直纠结于用Python2还是Python3.2008年底Python3.0.0发布,到现在已经7年了,Python3在逐渐取代Python2的低位.我在学Python基础语法的时候安装的Python3.4.3,看的是小甲鱼的视频,用的书是<Python基础教程>. 最近在用Python做仿真,需要安装Numpy.SciPy.MatPlotLib等科学计算的库,朋友推荐直接下载一个Python(x,y),这个软件包含了所有科学计算用到库,免去