谈谈Python实战数据可视化之pygal模块(基础篇)

前沿

对于需要在尺寸不同的屏幕上显示的图表,请考虑使用Pygal来生成它们,因为它们将自动缩放,以适合观看者的屏幕,这样它们在任何设备上显示时都会很美观。接下来我会谈谈pygal模块生成线、直方图的基本用法,用书本骰子的案例来更深入了解pygal模块的使用,对于pygal其他图形的创建其实方法差不多,实际运用时需要制作哪种图形就去官网查询,官网有很多图形创建的示例代码,pygal画廊官网链接:http://www.pygal.org/
如下方图(有图有代码,自己打一遍其实懂得也差不多了):

pygal绘制线图

绘制线图很简单,需要注意的是最后我们使用render_to_file将这个图表渲染为一个SVG文件,使用浏览器打开SVG文件方可查看生成的图表。
代码如下:

# 导入pygal可视化模块
import pygal

line_chart = pygal.Line()  # 创建一个线图的实例化对象
line_chart.title = ‘Browser usage evolution (in %)‘  # 设置标题
line_chart.x_labels = map(str, range(2002, 2013))  # 设置X轴标签,从2002年到2013年
# 下面是添加四条由11个点连成的线
line_chart.add(‘Firefox‘, [None, None, 0, 16.6, 25, 31, 36.4, 45.5, 46.3, 42.8, 37.1])
line_chart.add(‘Chrome‘, [None, None, None, None, None, None, 0, 3.9, 10.8, 23.8, 35.3])
line_chart.add(‘IE‘, [85.8, 84.6, 84.7, 74.5, 66, 58.6, 54.7, 44.8, 36.2, 26.6, 20.1])
line_chart.add(‘Others‘, [14.2, 15.4, 15.3, 8.9, 9, 10.4, 8.9, 5.8, 6.7, 6.8, 7.5])
line_chart.render_to_file(‘bar_chart.svg‘)  # 将图像保存为SVG文件,可通过浏览器查看

运行结果如下:

pygal绘制水平线图

基本用法跟绘制线图类似,代码如下:

# 导入pygal可视化模块
import pygal

line_chart = pygal.HorizontalLine()  # 创建一个水平线图的实例化对象
line_chart.title = ‘Browser usage evolution (in %)‘  # 设置标题
line_chart.x_labels = map(str, range(2002, 2013))  # 注意,这里的是水平线图,那么X轴就变为Y轴,Y轴变为X轴,所以这里map返回的值应用于Y轴
# 下面是添加四条由11个点连成的线
line_chart.add(‘Firefox‘, [None, None, 0, 16.6, 25, 31, 36.4, 45.5, 46.3, 42.8, 37.1])
line_chart.add(‘Chrome‘, [None, None, None, None, None, None, 0, 3.9, 10.8, 23.8, 35.3])
line_chart.add(‘IE‘, [85.8, 84.6, 84.7, 74.5, 66, 58.6, 54.7, 44.8, 36.2, 26.6, 20.1])
line_chart.add(‘Others‘, [14.2, 15.4, 15.3, 8.9, 9, 10.4, 8.9, 5.8, 6.7, 6.8, 7.5])
line_chart.range = [0, 100]  # 设置X轴的范围
line_chart.render_to_file(‘bar_chart.svg‘)  # 将图像保存为SVG文件,可通过浏览器查看

运行结果如下:

pygal绘制直方图

基本用法跟上面类似,代码如下:

# 导入pygal可视化模块
import pygal

frequency = [10, 20, 30, 40, 50, 60]
bar = pygal.Bar()  # 创建一个直方图的实例化对象
bar.title = ‘test‘  # 设置标题
bar.x_labels = [‘1‘, ‘2‘, ‘3‘, ‘4‘, ‘5‘, ‘6‘]
bar.x_title = "Result"
bar.y_title = "Frequency of Result"

bar.add(‘D‘, frequency)
bar.render_to_file(‘bar_chart.svg‘)  # 将图像保存为SVG文件,可通过浏览器查看

运行结果如下:

使用Pygal模拟掷一个骰子

完成这个掷骰子项目需要以下几步:
1.创建Die骰子类来模拟人类掷骰子的过程
2.将每次掷骰子后的点数,还有点数对应出现的次数分别保存在results和frequencies列表中
3.根据第二步获取的数据results和frequencies列表来绘制直方图
代码如下:
(1)创建Die骰子类来模拟人类掷骰子的过程
在工程目录下创建一个die.py文件,文件代码如下:

from random import randint

class Die:
    def __init__(self, num_sides=6):
        """骰子默认为6面,也可以自定义面数"""
        self.num_sides = num_sides

    def roll(self):
        """返回一个1到骰子面数之间的随机值来模拟人掷骰子的结果值"""
        return randint(1, self.num_sides)

(2)将数据保存到results和frequencies列表中,并根据数据使用Pygal来绘制直方图
在工程目录下创建一个dice_visual.py文件,代码如下:

# 下面是掷一个六面骰子的案例
from die import Die
import pygal

# 实例化一个Die类对象
die = Die()

results = []
for roll_num in range(1000):
    result = die.roll()  # 调用实例化对象的roll方法随机生成一个数字,在1-6之间的数字模拟掷骰子
    results.append(result)  # 将结果放入results列表
frequencies = []
# 将实验的结果数据统计出每个数字出现的次数
for value in range(1, die.num_sides + 1):
    frequency = results.count(value)
    frequencies.append(frequency)

# 绘制直方图
# 实例化一个bar对象,对该对象的title、x_labels、x_title、y_title属性设置相当于在直方图设置。
hist = pygal.Bar()
hist.title = "Results of rolling one D6 1000 times"
hist.x_labels = [‘1‘, ‘2‘, ‘3‘, ‘4‘, ‘5‘, ‘6‘]
hist.x_title = "Result"
hist.y_title = "Frequencies of result"

hist.add(‘D6‘, frequencies)
hist.render_to_file(‘die_visual.svg‘)

运行结果如下:

从上面的图表可以看出,掷一个D6骰子,每个点数出现的可能性接近相等,若掷骰子的次数更大, 那么每个点数出现的概率就越接近于6分之1.

使用Pygal模拟掷两个骰子

前面的案例是掷一个骰子,较为简单。这次案例是掷两个骰子,获取的点数更多,结果分布情况也不同。我们创建两个骰子,以模拟同时掷两个骰子的情况,每次掷两个骰子时,我们都将两个骰子的点数相加,并将结果存储在results中。最后,利用Pygal模块绘制直方图。
修改dice_visual.py文件代码如下:

# 下面是掷两个六面骰子的案例
from die import Die
import pygal

# 实例化两个个Die类对象
die_1 = Die()
die_2 = Die()

results = []
for roll_num in range(1000):
    result = die_1.roll() + die_2.roll()  # 将两次模拟掷骰子的值相加
    results.append(result)  # 将结果放入results列表
frequencies = []
max_result = die_1.num_sides + die_2.num_sides
# 将实验的结果数据统计出每个数字出现的次数
for value in range(2, max_result + 1):  # 两个骰子相加最小也是2
    frequency = results.count(value)
    frequencies.append(frequency)

# 绘制直方图
# 实例化一个bar对象,对该对象的title、x_labels、x_title、y_title属性设置相当于在直方图设置。
hist = pygal.Bar()
hist.title = "Results of rolling two D6 dice 1000 times"
hist.x_labels = list(range(2, max_result + 1))
hist.x_title = "Result"
hist.y_title = "Frequencies of result"

hist.add(‘D6 + D6‘, frequencies)
hist.render_to_file(‘dice_visual1.svg‘)

运行结果如下:

从上面的图表可以看出掷两个D6骰子,总点数为2或12的可能性最小,而总点数为7的可能性最大,这是因为在6种情况(1和6,2和5,3和4,4和3,5和2,6和1)下得到的总点数都为7。

使用Pygal模拟掷两个面数不同的骰子

下面创建一个6面骰子和10面骰子,然后同时掷两个骰子50000次。
再次修改dice_visual.py文件代码如下:

# 下面是掷两个面数不同的骰子案例
from die import Die
import pygal

# 实例化两个Die类对象
die_1 = Die()
die_2 = Die(10)  # 注意这里传入10

results = []
for roll_num in range(50000):
    result = die_1.roll() + die_2.roll()
    results.append(result)  # 将结果放入results列表
frequencies = []
max_result = die_1.num_sides + die_2.num_sides
# 将实验的结果数据统计出每个数字出现的次数
for value in range(2, max_result + 1):
    frequency = results.count(value)
    frequencies.append(frequency)

# 绘制直方图
# 实例化一个bar对象,对该对象的title、x_labels、x_title、y_title属性设置相当于在直方图设置。
hist = pygal.Bar()
hist.title = "Results of rolling a D6 and a D10 50,000 times"
hist.x_labels = list(range(2, max_result + 1))
hist.x_title = "Result"
hist.y_title = "Frequencies of result"

hist.add(‘D6 + D10‘, frequencies)
hist.render_to_file(‘dice_visual2.svg‘)

运行结果如下:

原文地址:http://blog.51cto.com/12731497/2160306

时间: 2024-09-29 04:45:36

谈谈Python实战数据可视化之pygal模块(基础篇)的相关文章

谈谈Python实战数据可视化之pygal模块(实战篇)

前沿 通过上一节谈谈Python实战数据可视化之pygal模块(基础篇)的学习,我们对pygal模块的使用有了初步的了解,本节将以实战项目来加深pygal模块的使用.从网上可以下载JSON格式的人口数据,并使用json模块来处理它们,pygal模块提供了一个适合初学者使用的地图创建工具,我们将使用它来对人口数据进行可视化,以探索全球人口的分布情况.针对JSON格式的人口数据文件,可以通过谈谈Python实战数据可视化之matplotlib模块(实战篇)章节的配套资源来下载.对于本人在学习和编码过

谈谈Python实战数据可视化之pyplot模块

前沿 Python提供了很多模块用于数据可视化,其中有matplotlib.pygal.我参考网上热门书籍<Python编程从入门到实战>,在测试与学习过程中遇到的些许问题加以解决,才写下这一项目实战的心得,对于Python基础部分就不细讲,主要是项目核心要点和解决方案的描述.本小节先讲述pyplot模块的基本使用. 新手的建议 针对新手,真心觉得不要直接使用Python下载来的IDLE来开发,因为功能太少了,也不好使用.我的建议是对于Python初学者,先安装Anaconda,这是一个基于P

Python数据可视化(Pygal、svg、csv、Bar、Line)

一.pygal(图表类型Bar) 将使用Python可视化包Pygal来生成可缩放的矢量图形文件 pygal官方文档:[www.pygal.org/en/stable/](http://www.pygal.org/en/stable/) 1.安装pygal pip install pygal -i https://pypi.tuna.tsinghua.edu.cn/simple 2.简单的python图表 import pygal pygal.Bar()(1, 3, 3, 7)(1, 6, 6,

Python - matplotlib 数据可视化

在许多实际问题中,经常要对给出的数据进行可视化,便于观察. 今天专门针对Python中的数据可视化模块--matplotlib这块内容系统的整理,方便查找使用. 本文来自于对<利用python进行数据分析>以及网上一些博客的总结. 1  matplotlib简介 matplotlib是Pythom可视化程序库的泰斗,经过几十年它仍然是Python使用者最常用的画图库.有许多别的程序库都是建立在它的基础上或直接调用它,比如pandas和seaborn就是matplotlib的外包, 它们让你使用

基于Python的数据可视化库pyecharts介绍

什么是pyecharts? pyecharts 是一个用于生成 Echarts 图表的类库. echarts 是百度开源的一个数据可视化 JS 库,主要用于数据可视化.pyecharts 是一个用于生成 Echarts 图表的类库.实际上就是 Echarts 与 Python 的对接. 使用 pyecharts 可以生成独立的网页,也可以在 flask , Django 中集成使用.pyecharts包含的图表 Bar .Bar3D.Boxplot.EffectScatter .Funnel.G

Python图表数据可视化Seaborn:3. 线性关系| 时间线| 热图

1. 线性关系数据可视化 lmplot() import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns % matplotlib inline sns.set_style("darkgrid") sns.set_context("paper") # 设置风格.尺度 import warnings warnings.filterwarnings

Python图表数据可视化Seaborn:2. 分类数据可视化

1. 分类数据可视化 - 分类散点图 stripplot() / swarmplot() import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns % matplotlib inline sns.set_style("whitegrid") sns.set_context("paper") # 设置风格.尺度 import warnings

Python进行数据可视化的9种常见方法,总有一种是你要用的

其实利用 Python 可视化数据并不是很麻烦,因为 Python 中有两个专用于可视化的库 matplotlib 和 seaborn 能让我们很容易的完成任务. 我们用 Python 可以做出哪些可视化图形? 当你给别人一个表格比如: 这个表给别人看起来,既不舒服,也不好观看.最最最最最最重要的一点就是low! 在学习过程中有什么不懂得可以加我的 python学习交流扣扣qun,784758214 群里有不错的学习视频教程.开发工具与电子书籍. 与你分享python企业当下人才需求及怎么从零基

python项目---数据可视化(02)

今天编写程序时,发现了一个有趣的现象.当执行import语句时,运行以后,将会脚本目录下生成一个__pycache__文件.于是做了如下总结解释: 一. python基本运行机制 Python程序运行时不需要编译成二进制代码,而直接从源码运行程序,简单来说是,Python解释器将源码转换为字节码,然后再由解释器来执行这些字节码. 解释器的具体工作: 1 完成模块的加载和链接: 2 将源代码编译为PyCodeObject对象(即字节码),写入内存中,供CPU读取: 3 从内存中读取并执行,结束后将