感动到流泪!数据分析师的福音:跨视图粒度计算

作者:王文开

网易有数中,我们的目标是使数据分析成为一种愉快的行为。

个人认为一款优秀的数据分析工具应该是能够做到:当用户在使用它做数据分析的时候,已经忘记了工具的存在,而是能够集中关注于发现数据背后揭示的故事。这个可以叫做experience flow,是一种沉浸在数据分析中的喜悦状态。

同时,你一定遇到过这样的情况:有时,你遇到了一个问题,其实是很容易描述清楚的,但当你试图在网易有数中展示并回答,会发现它竟是很难的。此时,刚才提到的experience flow,就没有了感觉,你需要开始思考如何重新处理数据,此时你的分析思路会打断,而不是集中在问题和答案。对于业务分析师来说,这是郁闷的,他们遇到了困境却不知道如何着手。

如上这些问题的核心是:

数据,需要可以自由汇总到不同的粒度,并且不同粒度的数据能够在一张表里进行展现。

这么说比较抽象,我们来举一个具体的电商场景的例子

某家电商成立于2013年,有一天数据分析师在利用网易有数做数据分析,首先她想看一下每年销售额的增长情况,于是在有数中,很容易做出了如下的柱状图。她很满意,销售额一直在增长。

销售额趋势

此时,她的脑海中出现了新的想法,她想看一下"每年的销售额究竟都是由哪一年的客户贡献的?"

首先我们来分析一下她的问题,什么叫“由哪一年的客户贡献的”?

于是她先在有数中做一个简单的表格,把“客户名称","订单ID","订单日期"放入Y轴,得到如下图表。可以看到,丁君这个客户一共买过4个订单,最早的购买日期是"2013-03-01",那我们就可以认为丁君这个客户是2013年的客户。所以我们就其实就是要在有数中计算出每个客户首次购买时间,这样我们就能知道该客户是哪一年的客户了

试探表格

现在,我们的目标就是计算出“每个客户的首次购买时间”。

怎么做,是不是脑海中浮现出的第一个想法是 min([订单日期]),恭喜你,已经成功了一半了

首先我们创建一个计算度量,如下图

最早购买日期

然后把这个字段加到图上,却发现,并不是我们期待的效果。“订单日期”和“最早购买日期”这两列的数据完全一样。为什么会这样?这就涉及到了图表聚合粒度的问题,这块内容我会在后续其他文章中详细阐述。

这里我想说的是,当前图表中有“客户名称”,“订单ID”,“订单日期”,这些维度字段都会确定图表的聚合粒度,所以min([订单日期]),这个聚合方式是会收到当前图表粒度影响的。所以才会一模一样。

最早购买日期

所以,我们现在需要有一种方式,能够指定这个日期的聚合粒度(维度),且不受图表上的粒度所影响。

网易有数在这个版本中加入了重磅功能:跨视图粒度计算表达式(Cross Level Calculation),下文简称CLC。

CLC,一共有三种形式,INCLUDE,EXCLUDE,FIXED,后边我们一点点来揭开他们。

在当前的例子中,我们会需要用到FIXED表达式,他们的格式看起来像这样:

FIXED表达式

注意,蓝色部分看着熟悉吧,就是刚才那个基本的数据聚合公式----最小值。红色的部分是一个新的容器,它告诉网易有数在执行蓝色部分求最小日期的时候,在哪个数据粒度进行计算,如在FIXED公式中,就是告诉网易有数,仅仅在“客户名称”这个粒度,对订单日期求最小,不考虑任何其他的粒度,也就是不考虑当前图表上的粒度。

于是我们创建了一个计算维度,如下写了FIXED表达式

每个客户的首次购买时间

此时,再把“每个客户首次购买时间”,拖入图表,这下就对了,这个字段不会受到图表上的粒度影响。

每个客户首次购买时间

ok,现在万事俱备了,现在只需要将“每个客户首次购买时间”放到颜色栏,就能区分出每一年的销售额里面,有多少是2013年的客户,有多少是2014年的客户,...贡献的

比如,可以从下图可以看到:

1、2013年是这个电商的第一年,那所有的销售额肯定是当年客户贡献的

2、2014年的销售额中,有224.3万是2013年客户贡献的,有116.8万是2014年客户贡献的

新客销售额贡献情况

如果不想看绝对值,可以将图表改成堆叠百分比柱状图。这样就能看到每年销售额里面,各个年份的客户的贡献百分比。

这样就能看出问题了:

这家电商虽然销售额逐年上升,但是新客的贡献率越来越低

2014年的销售额里面,新客的贡献率只有34.24%

2015年的销售额里面,新客的贡献率降到了9.31%

2016年的销售额里面,新客贡献率更低了

新客销售额占比

这就是网易有数中跨视图粒度计算的一个小案例,真是冰山一角,敬请期待后续更多案例!

原文首发:网易大数据

原文地址:https://www.cnblogs.com/163yun/p/8855887.html

时间: 2024-08-30 10:46:55

感动到流泪!数据分析师的福音:跨视图粒度计算的相关文章

深入浅出“跨视图粒度计算”--3、EXCLUDE表达式

本文由  网易云发布. 深入嵌入"跨视图粒度计算"的前面两篇分别讲了 1.理解数据的粒度 2.INCLUDE表达式 这一篇讲一下EXCLUDE表达式的用法. EXCLUDE,中文译为"排除",顾名思义,这个表达式和INCLUDE表达式是对立的,语法规则如下: { EXCLUDE [维度] : 聚合表达式 } 比如我们先做了下图,看了每个"类别"下,各个子类别的总销售额 如果此时我们想在这张图上看每个类别的总销售额,那该怎么做呢? 我们可以使用EX

深入浅出“跨视图粒度计算”--2、INCLUDE表达式

本文由  网易云发布. 上一篇,讲了什么是数据的粒度,以及网易有数中,哪些地方能够改变视图上的数据粒度. 现在正式开始跨视图粒度计算表达式的讲解,我们首先来看一下INCLUDE表达式 { INCLUDE [维度] : 聚合表达式 } 我们用以下的示例数据来举个例子.这份数据显示了在2014年的1月和2月间,有A.B和C三个客户有一些花费记录. 首先,我在网易有数中展示这两个月的花费总额,将"Date"字段放置在X轴,并且按照"月"的粒度."Spend&qu

漫画解读“跨视图粒度计算”,了解有数分析利器

本文来自网易云社区. 刚接触网易有数的用户,可能会认为有数只是一款数据可视化工具,但其实有数不单单能可视化数据,还能对数据进行计算分析,实现复杂的数据分析需求. 本文要介绍的就是有数提供的众多数据分析功能之一-- 跨视图粒度计算(其实就是简单的3个函数,但能实现复杂的分析需求:比如新客贡献分析.留存分析.复购分析.RFM分析等等). 既然要跨视图粒度计算,那我们先来理解两个概念: 粒度.视图. 1.粒度:什么是数据粒度呢,它指的是一份数据的细化程度,这么解释有些抽象,可以看下我制作的一幅漫画(原

我的职业理想:成为数据分析师

我小时候的理想是将来做一名数学家,可惜长大了发现自己天赋不够,理想渐行渐远,于是开始考虑现实,开始做一些人生规划,我一直在思考将来从事何种职业,专注什么样的领域,重新定义着自己的职业理想.我现在的职业理想,比较简单,就是做一名数据分析师.我的职业理想:成为数据分析师 为什么要做数据分析师:在通信.互联网.金融等这些行业每天产生巨大的数据量(长期更是积累了大量丰富的数据,比如客户交易数据等等),据说到2020年,全球每年产生的数据量达到3500万亿GB:海量的历史数据是否有价值,是否可以利用为领导

数据分析师内幕揭秘,你想了解的前前后后都在这里

转自接地气的陈老师 系列1 本篇是陈老师<数据分析师的日常>系列连载第一篇.本篇给各种有兴趣的.好奇的.想学习.想转行的门外汉,做的有关数据分析师的科普简介,有兴趣的同学请传阅,业内各位老炮儿看了随意吐槽 数据分析师干什么的 问:你们叫数据分析师? 答:额,其实还有其他名字,比如有些公司喜欢加个"大",叫:大数据分析师--o(╯□╰)o 问:数据分析师是干什么的? 答:我们提供数据,以及基于数据的业务建议 比如:我们经常听到:这个月门店销售额是300万.数据分析师就是算出这

合格大数据分析师应该具备的技能

阶段一.业务数据分析师 课程一.数据挖掘/分析师之硬技能 - 必备常用工具使用与高级技巧 本部分内容主要介绍了数据挖掘.分析师.数据产品经理必备的常用工具的,主要有 Excel,Visio,Xmind,PPT的涉及图表数据分析方面的高级技巧,包括但不限于:数据透视表演练.Vision跨职能流程图演练.Xmind项目计划导图演练.PPT高级动画技巧等! 一.Excel 1)数据分析工具EXECL入门介绍2)数据透视表演练 3) 数据处理4) EXECL报告自动化5) PPT报告数据自动化 二.Vi

数据分析师如何构建自己的网气 IP

说明:以下经验来自爱数圈老大 邓凯的2019年年会分享,总结的很好.很多地方深有共鸣,保留下来也借以时刻提醒自己前行的路上不要走偏. 12月28日,咱们圈子在上海举行了一次年底聚会,有山西来的.有厦门来的,还有一些杭州.江苏来的小伙伴,本来聚会后本想请外地的圈友一起来吃饭,结果小雪忘记了是哪些人,所以只通知了几个外地的小伙伴,这里非常感谢大家的信任和支持. 聚会结束后,也邀请了现场帮忙的圈友们一起吃了饭,又畅聊了一番,大家纷纷表示与我结缘的故事,让我很有成就感,所以当天又喝了几杯(连续三天喝),

数据分析师之Excel数据处理与分析实战

Excel数据处理与分析实战 课程学习地址:http://www.xuetuwuyou.com/course/191 课程出自学途无忧网:http://www.xuetuwuyou.com 课程简介 本门课程详细介绍了 Microsoft Excel 的应用知识,Excel也称为电子表格,是Microsoft office 套装软件的一个重要组成部分.利用它可以进行各种数据的混合运算外,还可以应用于财务会计.统计分析.证券管理.决策管理以及市场营销等众多领域.正因为它具有如此广泛的应用,所以才得

2015CDAS中国数据分析师行业峰会:R语言量化投资数据分析应用

前言 第一次在以数据分析为切入点的会议上做演讲,感觉还是挺不一样的.大会分为"金融数据洞察","医疗数据洞察","电商数据洞察","大小数据洞察"的4个部分,分别介绍了数据分析在不同行业的应用情况.当然,这次我是在"金融数据洞察"分论坛. 我非常有幸作为分享嘉宾参加2015年的中国数据分析师行业峰会,分享R语言在金融领域中的应用. 目录 我的演讲主题:R语言量化投资数据分析应用 会议体验和照片分享 整体文章