数据分析可视化

数据之美

数据可视化的目的是让数据更高效
让读者更高效的阅读
突出数据背后的规律
突出重要因素
最后?美观
例子:词频图

图标的基本概念

Dimension

描述分析的角度和属性,分类数据
时间、地理位置、产品类型等
可以将一份数据比喻为一块蛋糕,维度即为切刀,将数据分开

Message

具体的参考数值,数值数据
元、销量、销售金额等

常见的图表

散点图

散点图主要解释数据之间的规律

气泡图

气泡图是三点图的变种,引入了第三个度量作为气泡大小
维度:1+,作为颜色
度量:3,其中一个是气泡的大小

单轴散点图

维度做Y轴,更倾向于洞察数据在不同类别下的数据规律
维度:1+,Y轴
度量:2

折线图

折线图经常用来观察数据随时间的变化趋势。
折线图的维度不宜过多,否者会非常混乱

面积图

面积图是折线图的变种。面积图更注重数据类别
之间随时间的趋势的变化关系

维度:1
度量:2

柱形图

并且柱形图是类别之间的关系

直方图

柱与柱之间的距离为0

正负比例柱形图

饼图

漏斗图

漏斗图是对转化过程的直观展示。

雷达图

适合于个体数据和属性可视化,比较偏描述性数据,常见于CRM,用户画像
例如王者荣耀的攻击防御能力分析

高级图标

树形图

适合数据量较大的情况,尤其类别比较多。比如各类电商的SKU
维度:1+
度量:1

桑基图

桑基图是揭示数据复杂变化趋势的图标。面积图是线性维度,而桑基图可以一对多或者多对一
维度: 2 source,target
度量: 1

热力图

数据在空间上的变化规律。譬如地理空间,网页浏览
维度:2
度量:1

热力图的变种

空间不一定是纯粹空间,
也可以是属性和维度的
规律组合,比如把它变
成星期表。
维度:1
度量:1
可以看一下github上面的代码提交量图

关系图

关系图
展现不同类别之间的数
据关系,常见于各类社
交社会媒体。
维度:2 source target
度量:0+

箱线图

箱线图
箱线图是统计用图表,用来研究和观察数据分布,也能对比数据分布。
维度:1+
度量:1

标靶图

标靶图
也称为子弹图,是变种
的条形图。常用于衡量
业务销售完成情况。
维度:1+
度量:2

词云图

词云图
文本分析利器,PPT常
客,卖弄大数据之必备
图表
维度:1
度量:0

地理图

数据和空间之间的关系。
地理图即可以通过经纬
度的数值度量绘制,也
能通过省市的类别维度
绘制。
维度:1(经纬或行政)
度量:1

图标绘制

初级图表

条形图

概述1

原文地址:https://www.cnblogs.com/lyhcc/p/11258397.html

时间: 2024-11-08 22:51:16

数据分析可视化的相关文章

BI大数据分析可视化软件系统开发

大数据时代,人们对数据的整理分析越来越重BI也称商业智能,商业智能一般被理解为将企业中所产生的数据转化为知识,帮助企业做出明智经营决策的辅助工具.BI大数据分析可视化软件适用于任何或产生数据的行业,尤其是现在是大数据时代,从大数据分析出的结论对各个企业都有深远影响. 这里所说的数据包括来自企业的业务系统的订单.库存.交易账目.客户和供应商等:以及来自企业所处行业和竞争对手的数据还有来自企业所处的其他外部环境中的各种数据. 而商业智能BI软件系统能够辅助的业务经营决策,既可以是操作层的,也可以是战

Tableau教程|Tableau数据分析可视化高手进阶

网盘地址:https://pan.baidu.com/s/1I_62iOajIRUXECLq8sj1JQ 提取码: gr9a 课程介绍:我想要自己进行数据分析,但是我只会EXCEL,不会SQL,不会JAVA,不会Python,不会开源工具,怎么办?我看到别人能用Tableau做出很高大上的可视化图表,但是我只会拖拖拽拽,颜色搭配也不好,怎么办?我总是不能选择最合适的图形去表达数据,我做的报表,别人总是很难看懂,我不知道怎么去用数据讲好一个故事,怎么办?我想连接到大数据,我想连接到Google A

Python数据分析-可视化“大佬”之Seaborn

Seaborn 既然有了matplotlib,那为啥还需要seaborn呢?其实seaborn是在matplotlib基础上进行封装,Seaborn就是让困难的东西更加简单.用Matplotlib最大的困难是其默认的各种参数,而Seaborn则完全避免了这一问题.seaborn是针对统计绘图的,一般来说,seaborn能满足数据分析90%的绘图需求,复杂的自定义图形,还是要Matplotlib.Seaborn旨在使可视化成为探索和理解数据的核心部分.其面向数据集的绘图功能对包含整个数据集的数据框

Python数据分析-可视化“大佬”之Matplotlib

Matplotlib--Python可视化包 折线图绘制 折线图适合二维的大数据集,还适合多个二维数据集的比较,主要是用于反映数据的发展趋势变化情况. ## 采用失业率的数据集进行绘制 import numpy as np from numpy import arange import pandas as pd import matplotlib.pyplot as plt dataSet = pd.read_csv("unrate.csv") # print(dataSet) dat

基于pandas python的美团某商家的评论销售数据分析(可视化续)

from pyecharts import Bar,Pie import pandas as pd import numpy as np import matplotlib.pyplot as plt import time df=pd.read_excel("all_data_meituan.xlsx") df.drop('comment',axis=1).head(2) df['avgPrice'].value_counts() # 同一家店的均价应该为同一个数值,所以这列数据没多

python数据分析入门学习笔记儿

学习利用python进行数据分析的笔记儿&下星期二内部交流会要讲的内容,一并分享给大家.博主粗心大意,有什么不对的地方欢迎指正~还有许多尚待完善的地方,待我一边学习一边完善~ 前言:各种和数据分析相关python库的介绍(前言1~4摘抄自<利用python进行数据分析>) 1.Numpy: Numpy是python科学计算的基础包,它提供以下功能(不限于此): (1)快速高效的多维数组对象naarray (2)用于对数组执行元素级计算以及直接对数组执行数学运算的函数 (3)用于读写硬盘

案例分享|数据可视化下的驱动业务增长

在我国,制造业有两种态势:一种是生产同质化产品,产品价格公开,利润几乎透明:一种是高新技术产品,利润大,但创新和管理成本高.如何在同质化的产品中做好精细化和管理和成本控制,如何驱动创新成为制造业重出产能过剩的包围圈的两大突破口. 泰尔重工股份有限公司(以下简称"泰尔重工"."公司")成立于2001年,主要从事工业万向轴.汽车零部件等产品的设计.研发.制造.销售与服务.泰尔重工是国家级技术创新示范企业,笔者发文时市值已超34亿.在信息化方面,2016年下半年,泰尔重工

陈为著《数据可视化》书评及思维导图

在确定数据可视化为自己研究主题之初,我经常上网搜寻相关资料.但是初期的收集经常是杂乱无章,缺乏系统规划的.以至于我产生了三个困扰我的问题,分别是: 1. 信息可视化与数据可视化,到底有什么区别?或者说infographics 与visualization之间有何区别? 2.data visualization就是数据挖掘之后的用于显示结果的统计图吗? 3.曾经在知乎上看见某资深程序员直言,数据可视化在国内除了折腾一下社交网络外,没什么好做的,是这样吗? 今年4月以来,我终于有时间仔细研究相关问题

数据可视化

在确定数据可视化为自己研究主题之初,我经常上网搜寻相关资料.但是初期的收集经常是杂乱无章,缺乏系统规划的.以至于我产生了三个困扰我的问题,分别是: 1. 信息可视化与数据可视化,到底有什么区别?或者说infographics 与visualization之间有何区别? 2.data visualization就是数据挖掘之后的用于显示结果的统计图吗? 3.曾经在知乎上看见某资深程序员直言,数据可视化在国内除了折腾一下社交网络外,没什么好做的,是这样吗? 今年4月以来,我终于有时间仔细研究相关问题