数据可视化之美
数据可视化的目的是为了让数据更高效,让读者可以更高效阅读,而不单是自己使用。
数据可视化首先需要突出数据背后的规律和重要因素,其次才是美观。
数字可视化应该基于实际业务背景,比如地铁线路图并没有按照真实的地理距离来划分,但它却准确直观的传递给用户最关注的重点:应该如何乘车才能到达某地。
图表绘制部分主要为实操,这里就不做分享。原课程可以参考如下链接:
如何七周成为数据分析师:Excel技巧之甘特图绘制(项目管理)
图表的基本概念
1. 维度和度量
首先需要对维度和度量的概念进行区分。维度表示分析数据的角度/属性,度量则是衡量这个属性的数值大小。
- 维度 Dimension:描述分析的角度和属性,属于分类数据。
- 如:时间、地理位置、产品类型
- 度量 measure:具体的参考数值,属于数值数据。
- 如:元、销量、销售额
2. 维度主要分为三大类的数据结构:文本(类别)、时间、数值
如:地区分类为文本维度,年份为时间维度,销售额为数值维度
维度之间可以互相转换,如一个人的年龄,本来是时间维度,但可以将其转换为“青年、中年、老年”,转换为文本维度
常见的可视化图表
1. 散点图
散点图的优势在于揭示数据间的关系,发觉变量与变量间的关联。
散点图需要至少需要两个维度数据,一列放置于 X 轴,一列放置于 Y 轴
对散点图进行扩展,可以绘制气泡图。
区别之处在于气泡图引入了第三个度量,作为气泡的大小
2. 折线图
折线图常用于观察数据随时间变动的趋势。
此时 X 轴为时间维度,Y 轴为数值维度。
对折线图进行拓展,可以绘制面积图。
区别之处在于面积图更易于对比各类别间的数据随时间变化的趋势,各类边数据此时是累加显示的。
3. 折线图
折线图常用于多个维度的比较和变化。
文本维度/时间维度通常作为X轴。数值型维度作为Y轴。柱形图至少需要一个数值型维度。
柱形图还有许多丰富的应用。例如堆积柱形图,瀑布图,横向条形图,横轴正负图等。
4. 饼图
饼图优点在于美观,但难以观察各类别间的差距。
5. 漏斗图
漏斗图主要反映一个转化流程,便于展示
6. 雷达图
也叫蛛网图,它在商务、财务领域应用较大,适合用在固定的框架内表达某种已知的结果。常见于经营状况,财务健康程度。
适用于个体的数据和属性可视化。
常见的高级图表
1. 树形图
树形图直观的以面积表示数值,以颜色表示类目。尤其适用于数据量较大类别较多的情况。
2. 桑基图
桑基图常用于表达信息的变动和流动状态,是揭示数据复杂变动趋势的图表。
桑基图可以一对多或多对一。如:用户在网页上的活动轨迹。
3. 热力图
热力图常用于表现数据在空间上的变化规律。
热力图也不一定表示纯粹空间,也可能是属性和维度的规律组合。
如在数据分析中常用热力图表示各特征间的线性关系。
4. 关系图
关系图常用于展示不同类别之间的数据关系,展现失误相关性和关联性。
如社交关系链、品牌传播
5. 箱线图
箱线图和直方图类似,主要用于统计中,用于观察数据分布情况和对比数据分布
6. 标靶图
也称子弹图,常用于衡量 KPI 完成情况
7. 词云图
词云图多用于展示,绘制简单
8. 地理图
地理图主要体现数据和空间之间的关系
原文地址:https://www.cnblogs.com/xingyucn/p/10403077.html