袋鼠云数据中台专栏(七):用户标签体系建设的四字箴言

本文作者:子玺

袋鼠云数据中台解决方案专家。拥有近10年大数据从业经验,拥有PMP项目管理资格认证,精通数据类项目的开发实施和管理。曾服务过国家工商总局、北京市工商局、北京市财政局、广州开发区大数据局、平湖人社局、海盐人社局等行政单位,担任多个大型数据项目的数据应用咨询顾问/项目经理。

正文:


一、什么是用户画像?什么是标签?

当我们从互联网时代逐渐步入大数据时代后,企业及消费者行为不可避免地要面临一系列改变与重塑。其中最大的变化莫过于,消费者的一切行为在企业面前似乎都将是「可视化」的,然而,「似乎」并不等于「一定」。海量数据赋予企业的不一定都是可用信息「如何能够让企业在排山倒海般的数据海洋里更清晰、更快速地感知电脑那一端具体某类用户的喜好,从而为做精准营销服务」一直以来都被热切讨论,其中最行之有效的方式就是基于行为大数据构建清晰的「用户画像」。

用户画像(User Profile)

是对现实世界中「用户」的数学建模,它能够完美地抽象出一个用户的信息全貌,为进一步精准、快速地分析用户行为习惯、消费习惯等重要信息,提供了足够的数据基础,奠定了精准营销的基础。之所以说用户画像是一种模型,是因为它是通过分析挖掘用户尽可能多的数据信息得到的,它从数据中来,但对数据做过了抽象,做过概念泛化,比数据要高,后面所有用户画像的内容都是基于这个展开的。比如「游戏宅」,这个肯定是挖掘分析出来的,不是说原来的数据中包含游戏宅这个属性。

标签(Tag)

则是某一种用户特征的符号表示,是我们观察、认识和描述用户的一个角度,例如刚刚的「游戏宅」,其实就是一个用户生活习惯的侧面标签。标签和用户画像的关系是整体和局部的关系,而这种关系则通过「标签体系」体现。

二、袋鼠云标签体系建设方法论

我们刚刚说到,用户画像其实就是标签的集合,那么如何构建这个集合呢?


经过多个项目的经验沉淀,袋鼠云整理了标签体系建设的四字箴言,那就是:「 建、用、优、精 」。我们说,罗马不是一天建成的,同样标签体系建设是个体系化的工作,需要不断的用业务来滋养,初步建立后,通过业务方的使用及反馈,不断优化它,并最终沉淀、精炼出一套适合企业自身发展诉求的标签体系。

下面,我们以典型互联网电商平台用户标签体系的构建过程为例来帮助大家理解。

在电商这个场景下,我们构建用户标签体系主要根据用户在历史时间内的网购行为记录,从网购时间点、内容深度剖析,针对用户的基础属性、社交行为、互动行为、消费行为、偏好习惯、财富属性、信用属性和地理属性等八大维度构建用户标签体系,以期综合描绘平台消费者的行为特征。

建设的过程分为六个基本步骤:

  1. 首先以业务视角梳理规划整个标签体系的架构,即上面所说的八个维度
  2. 无规矩不成方圆,在进行实际开发之前,我们要定义包括数据(指标)规范、模型设计规范、ETL规范在内的规范体系。前文也讲过,这个规范体系可以借助数栈产品帮助建立和执行
  3. 将分散在各个系统/应用的数据同步到大数据开发平台之上,包括结构化的业务数据、埋点采集的行为日志数据等
  4. 核心围绕“用户”,以唯一标识打通来自不同平台、系统、渠道的数据,基于OneData体系依次构建全域数据中心、萃取数据中心
  5. 在萃取数据中心基础上,进行各类标签的研发,例如事实类标签(性别、年龄段等)、业务类标签(钻石会员、普通会员等)、统计类标签(近90天下单金额等)、算法类标签(重要保持客户、高忠诚度客户等)
  6. 标签/画像投入应用,或对接至下游业务系统,产生业务价值。与此同时监控各类标签的使用与效果,统计出热门标签,替换掉不合理的标签,调整业务算法和规则,添加新的标签等,来进一步推动标签体系的梳理规划,逐步沉淀一套精华版标签集合

这其中,除了业务的输入以及数据的支撑外,要想快速建立一套科学的标签体系,还需要丰富的技术经验以及智能的工具或平台来提供助力,而袋鼠云则专注于为企业提供专业的数据技术服务及智能的大数据开发平台,有能力帮助企业最大限度地缩短“读懂用户“这个目标的实现过程。

三、小结

最后再对前面讲的内容进行一个小结,在大数据时代,机器要学会从比特流中解读用户,构建用户画像尤其重要,是上层各种数据应用的基础,也就是袋鼠云数据中台专栏下一期要讲的数据应用的内容。

构建用户画像的核心是进行标签体系建设,合理的标签体系不是一次性工程,它需要不断地被业务滋养。为此,袋鼠云总结了标签体系建设的四字经验:建、用、优、精。

最后,袋鼠云拥有丰富的企业数据项目落地经验,有能力帮助企业构建科学合理的标签体系,为企业数据价值最大化提供助力。

原文地址:http://blog.51cto.com/13766600/2157357

时间: 2024-10-30 00:48:57

袋鼠云数据中台专栏(七):用户标签体系建设的四字箴言的相关文章

袋鼠云数据中台专栏2.0 | 企业数字化建设三范式

袋鼠云数据中台专栏V2.0 数据中台如何定义? 企业数据化与数据中台的关系是什么? 数据中台如何支撑企业战略转型? 袋鼠云近两年来,先后为国内数十家大型龙头企业提供数据中台咨询与实施落地服务,积累了大量的实战经验,同时也在为客户服务的过程中,不断完善和升华自身的数据中台理论体系和实践方法论.希望通过后续文章的分享,与诸位读者交流,共同加快企业全面数据化进程. 本专栏每周更新1-2篇,敬请期待~ 袋鼠云数据中台专栏V2.0 Vol.04,企业数字化建设三范式 1 笔者的职业生涯是从研发岗位开始的,

袋鼠云数据中台专栏2.0 | 企业数据化认知:数据就是生产力!

关于袋鼠云数据中台专栏V2.0 数据中台如何定义?企业数据化与数据中台的关系是什么?数据中台如何支撑企业战略转型? 袋鼠云近两年来,先后为国内数十家大型龙头企业提供数据中台咨询与实施落地服务,积累了大量的实战经验,同时也在为客户服务的过程中,不断完善和升华自身的数据中台理论体系和实践方法论.希望通过后续文章的分享,与诸位读者交流,共同加快企业全面数据化进程. 本专栏每周更新1-2篇,敬请期待~ 正文 一. 数据就是生产力.笔者两年前在袋鼠云做的国内某省一个交警项目上,面对着海量的车辆轨迹数据时,

袋鼠云数据中台专栏2.0 | 数据中台综述:三个维度看数据中台

一.关于数据中台的9个名词 数据中台是什么,当前有很多解释,但是它一定不是哈姆雷特. 新兴的事物总会被各种解读,但是当人们足够熟悉了以后,总会有一个公允的定义得到广泛的认可和接受.这个过程中,最可以用于度量的便是「功能定义」与「业务价值」.袋鼠云认为,数据中台表现出的最主要特征是一种企业数据化体系的架构,而且就目前而言,这种架构是最为有效的一种架构. 目前很多人把数据中台直接等同于企业数据化,AI和大数据,或者是直接的业务价值,甚至企业变革(比如新零售).这些都是不准确的,数据中台的价值被过于放

袋鼠云数据中台专栏2.0 | 数据中台之数据集成

关于袋鼠云数据中台专栏V2.0 数据中台如何定义?企业数据化与数据中台的关系是什么?数据中台如何支撑企业战略转型?袋鼠云近两年来,先后为国内数十家大型龙头企业提供数据中台咨询与实施落地服务,积累了大量的实战经验,同时也在为客户服务的过程中,不断完善和升华自身的数据中台理论体系和实践方法论.希望通过后续文章的分享,与诸位读者交流,共同加快企业全面数据化进程.本专栏每周更新1-2篇,敬请期待~ 数据中台之数据集成 1 在现代企业中,由于使用场景.业务形态.技术选型.开发架构的差异,往往有多个异构的.

袋鼠云数据中台专栏2.0 | 企业三界:业务界面,应用界面,数据界面

关于袋鼠云数据中台专栏V2.0 数据中台如何定义?企业数据化与数据中台的关系是什么?数据中台如何支撑企业战略转型? 袋鼠云近两年来,先后为国内数十家大型龙头企业提供数据中台咨询与实施落地服务,积累了大量的实战经验,同时也在为客户服务的过程中,不断完善和升华自身的数据中台理论体系和实践方法论.希望通过后续文章的分享,与诸位读者交流,共同加快企业全面数据化进程. 本专栏每周更新1-2篇,敬请期待~ 正文 一.企 业 三 界 本篇文章阐述「企业业务」.「企业信息化」,「企业数据化」三者之间的关系. 界

袋鼠云数据中台专栏(六):企业数据指标的那些事儿

本文作者:子玺 袋鼠云数据中台解决方案专家.拥有近10年大数据从业经验,拥有PMP项目管理资格认证,精通数据类项目的开发实施和管理.曾服务过国家工商总局.北京市工商局.北京市财政局.广州开发区大数据局.平湖人社局.海盐人社局等行政单位,担任多个大型数据项目的数据应用咨询顾问/项目经理. 一.企业指标体系的重要性不言而喻 在我们谈论指标之前,先将时间倒推几十年,现代管理学之父彼得·德鲁克说过一句很经典的话:如果你不能衡量它,那么你就不能有效增长它.所谓衡量,就是需要统一标准来定义和评价业务,这个标

数据中台专栏(五):数栈,企业级一站式数据中台PaaS

本文作者:江枫 袋鼠云CTO,花名江枫,本名宁海元. 2007年加入淘宝,曾是双十一大促技术指挥部成员,"去IOE"数据库负责人.打造过千亿级实时日志平台.手机淘宝日志分析创始人.阿里云数加平台技术创始人. 正文: 2014年还在阿里云的时候,内部有一个5K+的项目,集合了当时CDO的多支团队在北京联合关小黑屋,希望能够将内部广泛使用的一套大数据开发工具打造成在公共云上对外服务的大数据PaaS.事后来看,这个项目当时有很多争执,也算不上多成功,尤其是和前一个名字类似的5K项目相比,有点

数据中台专栏(三):数据质量分析及提升

本文作者:笑天 袋鼠云数据解决方案专家.拥有10余年IT行业开发和管理等企业服务经验,精通大型项目的开发和管理,曾就职于英特尔.索尼等世界500强企业,参与过英特尔,索尼,三星,华为等公司的大型项目的开发和咨询工作.近几年主攻大数据方向,包括数据中台建设.大数据治理.工业领域的数据应用等项目开发和实施. 正文:正文 大量的信息成倍增加,但有用的信息却非常有限. 信号是真相,噪声却使我们离真相越来越远. --<信号与噪声:大数据时代预测的科学与艺术> [美]纳特·西尔弗 一般情况下,企业都有多套

奇点云数据中台技术汇(一)DataSimba——企业级一站式大数据智能服务平台

在这个“数据即资产”的时代,大数据技术和体量都有了前所未有的进步,若企业能有效使用数据,让数据赚钱,这必将成为企业数字化转型升级的有力武器. 奇点云自研的一站式大数据智能服务平台——DataSimba,旨在提供数据采集.数据加工.数据治理.数据规范.数据资产.数据服务等全链路的产品+技术+方法论服务,构建面向业务应用的大数据智能平台.其主要核心模块包括了数据开发套件.数据治理套件.数据服务引擎.数据智能.数据安全. 1.数据采集 数据采集作为数据中台第一个环节,不仅仅是要“采集”,也要将数据合理