数据可视化之Matplotlib学习

推荐学习地址:https://www.imooc.com/learn/1178

以下是自己学习的主要内容

1.数据分析及可视化概念

数据分析指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程

  收集数据---提取信息 ---形成结论

数据可视化:使用图形化展示数据,直观的观测数据之间的关系即为数据可视化过程

2.数据分析可视化流程

  定义分析目标---数据采集及预处理---数据分析挖掘---数据可视化

  数据清洗:是指发现并纠正数据文件中可识别的错误的最后一道程序,包括检验数据一致性、处理无效值和缺省值等

3.常见的数据可视化形式及工具

常见的可视化形式:

  基础:统计图(直方图、折线图、饼图)

     分布图(热力图、散点图、气泡图)

常用工具:

  分析工具:pandas、Scipy、numpy、sklearn

  绘图工具:matplotlib、Pychart、reportlab

  平台工具:Jupyter Notebook、Pycharm

基础图:

  直方图:可直观的传递数据的分布情况。函数:plt.hist(data, bins)

  条形图:展现同类数据的大小以及数据之间的差别。函数:plt.bar(data,datatype)

  折线图:通常显示随时间变化的连续数据,因此非常适用显示数据在周期内的趋势。函数:plt.plot(X,Y)

  饼图:常用于显示一个数据系列中各项的大小和各项总和的比例。函数:plt.pie(data,datatype)

  散点图:是指在回归分析中,数据点在直角坐标系平面上的分布图,散点图表示因变量随自变量而变化的大致趋势,据此可以选择合适的函数对数据点进行拟合。函数:plt.scatter(data_X, data_Y)

  箱线图:又称为盒须图、盒式图,是一种用作显示一组数据分散情况的统计图,主要用于反映原始数据的特征,主要有展示图值有:上边缘 下边缘 中位数 上四分位数 下四分位数 异常值(点)。函数:plt.boxplot(data)

  极线图:用于表示极坐标下数据的分布情况,多用于显示具有一点周期性的数据。函数:plt.subplot(111, projection = ‘polar‘).plot(theta, r)

  阶梯图:是一种以无规律、间歇性阶跃的方式表达数值变化的方法,它不仅可以像折线图反映数据发展的趋势,还可以反映数据状态的持续时间。函数:plt.step(year, height)

高级图:

  堆积图:常用于综合展示不同分类的指标趋势以及总和的趋势。函数:plt.bar(datatype, data_y, bottom = data_x, color = ‘r‘, label = ‘name‘)

  分块图:可将不同数据集分块展示,方便对比同类数据某一具体属性的高低。函数:plt.bar(datatype, data_y, bottom = data_x, color = ‘r‘, label = ‘name‘)

  气泡图:可用来展示是三个变量之间的关系。函数:plt.bar(x, data_x, label="name", fc = ‘r‘, width = width)

图例展示地址:

原文地址:https://www.cnblogs.com/no-end-to-learning/p/11789173.html

时间: 2024-08-14 19:34:37

数据可视化之Matplotlib学习的相关文章

数据可视化神器matplotlib学习之路(四)

今天画一下3D图像,首先的另外引用一个包 from mpl_toolkits.mplot3d import Axes3D,接下来画一个球体,首先来看看球体的参数方程吧 (0≤θ≤2π,0≤φ≤π) 然后就可以上代码了: from matplotlib import pyplot as plt import numpy as np from mpl_toolkits.mplot3d import Axes3D a = np.linspace(0, np.pi*2, 20) b = np.linsp

Python进阶(三十九)-数据可视化の使用matplotlib进行绘图分析数据

Python进阶(三十九)-数据可视化の使用matplotlib进行绘图分析数据 ??matplotlib 是python最著名的绘图库,它提供了一整套和matlab相似的命令API,十分适合交互式地进行制图.而且也可以方便地将它作为绘图控件,嵌入GUI应用程序中. ??它的文档相当完备,并且 Gallery页面 中有上百幅缩略图,打开之后都有源程序.因此如果你需要绘制某种类型的图,只需要在这个页面中浏览/复制/粘贴一下,基本上都能搞定. ??在Linux下比较著名的数据图工具还有gnuplot

Python进阶(四十)-数据可视化の使用matplotlib进行绘图

Python进阶(四十)-数据可视化の使用matplotlib进行绘图 前言 ??matplotlib是基于Python语言的开源项目,旨在为Python提供一个数据绘图包.我将在这篇文章中介绍matplotlib API的核心对象,并介绍如何使用这些对象来实现绘图.实际上,matplotlib的对象体系严谨而有趣,为使用者提供了巨大的发挥空间.用户在熟悉了核心对象之后,可以轻易的定制图像.matplotlib的对象体系也是计算机图形学的一个优秀范例.即使你不是Python程序员,你也可以从文中

数据可视化库-Matplotlib基本操作

python-3.7     pycharm matplotlib 2.2.3 """ 数据可视化库-Matplotlib 时间:2018\9\12 0012 """ import numpy as np import pandas as pd import matplotlib as mpl import matplotlib.pyplot as plt print("""\n-------------------

Python数据可视化库-Matplotlib(一)

今天我们来学习一下python的数据可视化库,Matplotlib,是一个Python的2D绘图库 通过这个库,开发者可以仅需要几行代码,便可以生成绘图,直方图,功率图,条形图,错误图,散点图等等 废话不多说,我们直接通过例子来进行讲解. 首先我们有一组数据如下: 我们可以看到,这组数据有日期,还有日期对应的值,因为这组数据中的日期格式不是标准的日期格式 那么我们对数据做一下转换,取1948年的整年的数据,来进行一个绘图操作 import pandas as pd unrate = pd.rea

学机器学习,不会数据分析怎么行——数据可视化分析(matplotlib)

前言 前面两篇文章介绍了 python 中两大模块 pandas 和 numpy 的一些基本使用方法,然而,仅仅会处理数据还是不够的,我们需要学会怎么分析,毫无疑问,利用图表对数据进行分析是最容易的,通过图表可以很好地理解数据之间的关联性以及某些数据的变化趋势.因此,将在这篇博客中介绍 python 中可视化工具 matplotlib 的使用. Figure 和 Subplot matplotlib 的图像都位于 Figure 对象中,可以用 plt.figure 创建一个新的 Figure f

Python数据可视化——使用Matplotlib创建散点图

Matplotlib简述: Matplotlib是一个用于创建出高质量图表的桌面绘图包(主要是2D方面).该项目是由John Hunter于2002年启动的,其目的是为Python构建一个MATLAB式的绘图接口.如果结合Python IDE使用比如PyCharm,matplotlib还具有诸如缩放和平移等交互功能.它不仅支持各种操作系统上许多不同的GUI后端,而且还能将图片导出为各种常见的矢量(vector)和光栅(raster)图:PDF.SVG.JPG.PNG.BMP.GIF等. 此外,M

Python数据可视化之Matplotlib实现各种图表

数据分析就是将数据以各种图表的形式展现给领导,供领导做决策用,因此熟练掌握饼图.柱状图.线图等图表制作是一个数据分析师必备的技能.Python有两个比较出色的图表制作框架,分别是Matplotlib和Pyechart.本文主要讲述使用Matplotlib制作各种数据图表. Matplotlib是最流行的用于绘制2D数据图表的Python库,能够在各种平台上使用,可以绘制散点图.柱状图.饼图等. 1.柱状图 是一种以长方形或长方体的高度为变量的表达图形的统计报告图,由一系列高度不等的纵向条纹表示数

数据可视化之——matplotlib基础学习

一.Matplotlib 基础用法: import matplotlib.pyplot as plt import numpy as np x = np.linspace(-1, 1, 100) # 生成100个点 y = 2*x + 1 plt.plot(x, y) plt.show() 结果: 二.Matplotlib figure图像: import matplotlib.pyplot as plt import numpy as np x = np.linspace(-1, 1, 100