数据可视化(9)--数据可视化6步法

在当前互联网,各种数据可视化图表层出不穷,本文尝试对数据可视化的方法进行归纳,整理成6步法。一般的数据图表都可以拆分成最基本的两类元素: 所描述的事物及这个事物的数值,我们暂且将其分别定义为指标和指标值。比如一个性别分布中,男性占比30%,女性占比70%,那么指标就是男性、女性,指标值对应为30%、70%。

1. 将指标值图形化

一个指标值就是一个数据,将数据的大小以图形的方式表现。比如用柱形图的长度或高度表现数据大小,这也是最常用的可视化形式。
传统的柱形图、饼图有可能会带来审美疲劳,可尝试从图形的视觉样式上进行一些创新,常用的方法就是将图形与指标的含义关联起来。
比如Google Zeitgeist在展现top10的搜索词时,展示的就是“搜索”形状的柱形,图形与指标的含义相吻合,同时也做了立体的视觉变化:

2. 将指标图形化

一般用与指标含义相近的icon来表现,使用场景也比较多,如下:

3.将指标关系图形化

当存在多个指标时,挖掘指标之间的关系,并将其图形化表达,可提升图表的可视化深度。常见有以下两种方式:

借助已有的场景来表现

联想自然或社会中有无场景与指标关系类似,然后借助此场景来表现。
比如百度统计流量研究院操作系统的分布,首先分为windows、mac还有其他操作系统,windows又包含xp、2003等多种子系统。
根据这种关系联想,发现宇宙星系中也有类似的关系: 宇宙中有很多星系,我们最为熟悉的是太阳系,太阳系中又包括各个行星, 因此整体借用宇宙星系的场景,将熟知的windows比喻成太阳系,将xp、window7等比喻成太阳系中的行星,将mac和其他系统比喻成其他星系,表现如下:

构建场景来表现

指标之间往往具有一些关联特征,如从简单到复杂、从低级到高级、从前到后等等。如无法找到已存在的对应场景,也可构建场景。
比如百度统计流量研究院中的学历分布,指标分别是小学、初中、高中、本科等等,它们之间是一种越爬越高,从低等级到高等级的关系,那么,这种关系可以通过构建一个台阶去表现,如下:

支付宝新出的个人年度账单中,在描述付款最多的三项时,构建了一个领奖台的形式:

小结:

根据之前3步,可将指标、指标值和指标关系分别进行图形化处理。
以最简单的性别分布为例,可以得到一个线性的可视化过程,如下:

以上图示为供参考的线性化过程,实际可视化思考中,将哪类元素进行图形化或者图形化前后的顺序可能均有不同,需根据具体情况处理。

4. 将时间和空间可视化
时间
通过时间的维度来查看指标值的变化情况,一般通过增加时间轴的形式,也就是常见的趋势图。
空间
当图表存在地域信息并且需要突出表现的时候,可用地图将空间可视化,地图作为主背景呈现所有信息点。
Google Zeitgeist在2010和2012年的年度热门回顾中,都是以地图为主要载体(同时也结合了时间),来呈现热门事件:

5. 将数据进行概念转换

先看下生活中的概念转换,当我们需要喝水时,通常会说:给我来一杯水;而不会说:给我来30ml的水。在这里,30ml是一个实际数据,但是难以感知,所以用一杯的概念来转换。
同样在数据可视化,有时需要对数据进行概念转换,可加深用户对数据的感知。常用方法有对比和比喻:
对比:
下图是一个介绍中国烟民数量的图表:如果只看左半部分中国烟民的数量:32000000,知道数据量级很大,但具体有多大却很难感知;直到看到右半部分:中国烟民数量超过了美国人口总和,这样一对比,对数据的感知就加深了。

比喻

下图是一个介绍雅虎邮箱处理数据量的图表,大意是每小时处理的电子邮件大小有1.2TB,相当于644245094张打印的纸。
这又是一个很大的数据,但到底有多大? 在这里用了一个比喻的手法:644245094张纸,如果把每一张纸首尾对接,可以绕地球4圈多。到这里,能较深刻感受到雅虎邮箱处理的数据量之大,为地球节省了很多纸张。
更进一步地,还将这个比喻进行了图形化表现。

6.让图表“动”起来

数据图形化完成后,可结合实际情况,将其变为动态化和可操控性的图表,用户在操控过程中能更好地感知数据的变化过程,提升体验。
实现动态化通常以下两种方式: 交互和动画。

交互

交互包括鼠标浮动、点击、多图表时的联动响应等等,如下是百度统计流量研究院的时间分布图,采用左图右表的联动形式,左图中,鼠标浮动则显示对应数据,点击则切换选择:

动画

包括增加入场动画、交互过程的动画、播放动画等等。
入场动画:即在页面载入后,给图表一个“生长”的过程,取代“数据载入中”这样的提示文字。
交互动画:用户发生交互行为后,通过动画形式给以及时反馈。
播放动画:一般来是提供播放功能,像看视频一样,让用户能够完整看到数据随时间变化的过程。下图是Gapminder在描述多维数据时,提供随时间播放的功能,可以直观感受到所有数据的变化。

总结

数据可视化形式多样,思考过程也不尽相同。以上6步法,是基于“数据”层面(区别于信息可视化),梳理思考过程,总结设计方法,为后续可视化提供可借鉴的思路。

摘自: http://ued.baidu.com/?p=3909

例子: http://tongji.baidu.com/data/browser

题外话,D3的系列先暂时停一下,其实也已经停了很久了。。。

数据可视化(9)--数据可视化6步法

时间: 2024-10-11 22:10:06

数据可视化(9)--数据可视化6步法的相关文章

流形学习-高维数据的降维与可视化

1.流形学习的概念 流形学习方法(Manifold Learning),简称流形学习,自2000年在著名的科学杂志<Science>被首次提出以来,已成为信息科学领域的研究热点.在理论和应用上,流形学习方法都具有重要的研究意义. 假设数据是均匀采样于一个高维欧氏空间中的低维流形,流形学习就是从高维采样数据中恢复低维流形结构,即找到高维空间中的低维流形,并求出相应的嵌入映射,以实现维数约简或者数据可视化.它是从观测到的现象中去寻找事物的本质,找到产生数据的内在规律. 以上选自百度百科 简单地理解

写Kibana插件——可视化使用数据

Writing Kibana 4 Plugins – Visualizations using Data 在阅读本教程之前,您需要阅读第2部分 - 简单可视化. 在本教程系列的前一部分(这是本部分必读的一节)中,您已经学会了创建一个简单的可视化,它不需要访问Elasticsearch的数据.在这一部分,我们将编写另外一个插件,使用聚合(像极了可视化)从Elasticsearch访问数据. 我们将创建一个非常简单的标签云插件,它将桶名称显示为标签,并且根据指标聚合的结果决定了标签的字体大小.如果你

【数据可视化】数据可视化分类

数据可视化分为:科学可视化.信息可视化,可视化分析学这三个主要分支. 科学可视化,处理科学数据,面向科学和工程领域的科学可视化,研究带有空间坐标和几何信息的三维空间测量数据.计算模拟数据和医疗影像数据等,重点探索如何有效地呈现数据中几何.拓扑和形状特征.信息可视化,处理对象是非结构化.非几何的抽象数据,如金融交易.社交网络和文本数据,其核心挑战是如何针对大尺度高维数据减少视觉混淆对有用信息的干扰.可视分析学,由于数据分析的重要性,将可视化与分析结合,形成的新的学科. 科学可视化(Science

数据中心基础设施3D可视化管理!

数据中心3D可视化平台通过动态仿真和拟实环境的建立使参与者对虚拟机房或园区进行直感交互.实现优化,可视化管理,这种新颖的管理手段,可以大幅度提升数据中心机房用户的管理水平和效率,平台充分利用2D可视化技术在使用方面的便捷性和3D技术在空间展示.设备建模.空间计算和能耗分析等方面的优势,无缝对接用户现有各类运维手段和流程,帮助用户打造实现了一个完整的.可视的.规范的数据中心管理平台,弥补现有数据中心线下运维管理的不足,真正实现数据中心线上规划.线下作业的高度统一和闭环式管理. 一.技术特色 系统实

用Vue构建一个github“可视化大数据平台”-GitDataV,设计开发分享

写在前面 GitDataV,是一个github“大数据可视化平台”,通过它你可以更直观的看到你在github里的一些数据,(之所以打双引号,是因为我觉得这个还没到大数据可视化的程度).其实我在 上篇文章 分享的时候已经提到了这个想法,通过github提供的接口,做一个自己的“大数据分析页面”,所以我就花了几天晚上的时间,把这想法从设计到开发构建出来了,那么下面我就我个人的账号测试看看效果如下gif图 如果您感兴趣可以点击这里访问简单的:GitDataV网站(目前打包后有些小bug,但不影响正常使

大数据基础--大数据可视化(刘鹏《大数据》课后习题答案)

1.数据可视化有哪些基本特征? (1)易懂性,可视化可以使碎片化的数据转换成具有特定结构的知识,从而为决策支持提供帮助. (2)必然性,大数据所产生的数据量必然要求人们对数据进行归纳总结,对数据的结构和形式进行转换处理. (3)片面性,数据可视化的片面性特征要求可视化模式不能替代数据本身,只能作为数据表达的一种特定形式. (4)专业性,专业化特征是人们从可视化模型中提取专业知识的环节,它是数据可视化应用的最后流程. 2.简述可视化技术支持计算机辅助数据认识的3个基本阶段. (1)数据表达,数据表

第二篇:R语言数据可视化之数据塑形技术

前言 绘制统计图形时,半数以上的时间会花在调用绘图命令之前的数据塑型操作上.因为在把数据送进绘图函数前,还得将数据框转换为适当格式才行. 本文将给出使用R语言进行数据塑型的一些基本的技巧,更多技术细节推荐参考<R语言核心手册>. 数据框塑型 1. 创建数据框 - data.frame() # 创建向量p p = c("A", "B", "C") # 创建向量q q = 1:3 # 创建数据框:含p/q两列 dat = data.fra

python 数据可视化 -- 读取数据

从 CSV 文件中读取数据 import sys import csv # python 内置该模块 支持各种CSV文件 file_name = r"..\ch02_data\ch02-data.csv" # r 指明字符串不用转义 data = [] try: with open(file_name) as f: # 打开文件 reader = csv.reader(f) # 获取 reader 对象,通过对该对象的遍历获取文件的所有内容 header = next(reader)

解码阿里数据:对外数据产品也浮出水面

解码阿里数据:对外数据产品也浮出水面 2014-05-21 大数据时代,阿里巴巴[微博]集团是最有资本进行烂漫遥想的公司之一,阿里数据平台事业部的服务器上,攒下了超过100PB已"清洗"的数据. 马云[微博]曾在2012年公开宣称,"平台.数据.金融"是阿里集团和阿里小微集团未来的指导路线.在此前后,战略布局已经渐次展开: 2010年,推出重整的搜索业务"一淘",2011年收购数据属性公司CNZZ,近期又接连收购友盟.入股新浪微博和高德,抢占数据