如何构建电商用户画像

5.1 构建电商用户画像技术和流程

构建一个用户画像,包括数据源端数据收集、数据预处理、行为建模、构建用户画像

有些标签是可以直接获取到的,有些标签需要通过数据挖掘分析到!

5.2 源数据分析

用户数据分为2类:动态信息数据、静态信息数据

静态信息数据来源:

? 用户填写的个人资料,或者由此通过一定的算法,计算出来的数据

? 如果有不确定的,可以建立模型来判断,比如用户的性别注册没有填写,可以建立模型,根据用户的行为来判断用户性别是什么,或者它的概率

动态信息数据来源:

? 用户行为产生的数据:注册、游览、点击、购买、签收、评价、收藏等等。

? 用户比较重要的行为数据:游览商品,收藏商品、加入购物车、关注商品

根据这些行为特性可以计算出:用户注册时间、首单时间、潮妈族、纠结商品、最大消费、订单数量、退货数量、败家指数、品牌偏好等等。

5.3 目标分析

用户画像的目标是通过分析用户行为,最终为每个用户打上标签,以及该标签的权重。

如,红酒 0.8、李宁 0.6。

权重:表现了指数,用户的兴趣、偏好指数,也可能表现用户的需求度,可以简单的理解为可信度,概率。

5.4 用户画像建模5.4.1 用户基本属性表

根据用户所填写的属性标签和推算出来的标签。用于了解用户的人口属性的基本情况和按不同属性维度统计。

作用:按人口属性营销、比如营销80后,对金牛座的优惠,生日营销。

主要数据来源:用户表、用户调查表、孕妇模型表、马甲模型表。

用户表:记录用户最基本的属性特性。

用户调查表:补充用户的其他基本信息。

用户所填写的基本信息:用户ID、用户名、密码、性别、手机号、邮箱、年龄、户籍省份、×××编号、注册时间、收货地址等

用户所填信息计算得到的指标:

生日、星座、城市等级、手机前几位、手机运营商、邮件运营商

用户调查表得到:学历、收入、职业、婚姻、是否有小孩、是否有车有房、使用手机品牌。

根据算法得到:

身高、体重、性别模型、孩子性别概率、潜在汽车用户概率、是否孕妇、孩子年龄概率、手机品牌、更换手机频率、是否有小孩,是否有车,使用手机档次,疑似马甲标准、疑似马甲账号数、用户忠诚度、用户购物类型。

模型算法---性别模型

? 用户自己也填写了性别,但仍然要用算法算一次性别

? 性别验证方法

随机抽样几千条数据让客户打电话确认。

与用户自己填的性别做对比,确认百分比。

模型算法---用户汽车模型

模型算法---用户忠诚度模型

? 忠诚度越高的用户越多,对网站的发展越有利

模型算法---用户身高尺码模型

模型算法---用户马甲标志模型

? 马甲是指一个用户注册多个账号

? 多次访问地址相同的用户账号是同一个人所有

? 同一台手机登陆多次的用户是同一个人所有

? 收货手机号相同的账号同一个人所有

模型算法---手机相关标签模型

? 对于手机营销参考意义比较大

? 使用手机品牌: 最常用手机直接得到

? 使用手机品牌档次:根据档次维表

? 使用多少种不同的手机:手机登陆情况

? 更换手机频率(月份):按时间段看手机登陆情况

5.4.2 客户消费订单表

根据客户消费的情况提取的客户标签,用于了解用户的消费总体情况,

最终的目的根据用户消费习惯与消费能力做营销。

主要数据来源:订单表、退货表、用户表、购物车表

订单表可以得到相关标签:

退货表可以得到相关标签:

购物车表可以得到相关标签:

订单表和用户表可以得到相关标签:

5.4.3 客户购买类目表

根据客户购买类目的情况提取客户标签,用于了解类目的购买人群情况和针对某一类目的营销等。

主要数据来源:订单表、购物车表、类目维表

类目维表可以得到相关标签:

电商的三级类目:

京东商城:

淘宝:

订单表和类目维表可以得到相关标签:

购物车表和类目维表可以得到相关标签:

5.4.4 用户访问信息表

根据客户访问的情况提取相关客户标签。

用于了解用户的访问总体情况,方便根据客户游览习惯做营销

主要数据来源:点击流日志行为表(PC/APP端)

点击流日志行为表可以得到相关标签:

原文地址:https://blog.51cto.com/14473726/2427390

时间: 2024-11-10 20:28:06

如何构建电商用户画像的相关文章

电商用户画像环境搭建

众所周知,Hive的执行任务是将hql语句转化为MapReduce来计算的,Hive的整体解决方案很不错,但是从查询提交到结果返回需要相当长的时间,查询耗时太长.这个主要原因就是由于Hive原生是基于MapReduce的,那么如果我们不生成MapReduce Job,而是生成Spark Job,就可以充分利用Spark的快速执行能力来缩短HiveHQL的响应时间. 本项目采用SparkSql与hive进行整合,通过SparkSql读取hive中表的元数据,把HiveHQL底层采用MapReduc

基于大数据的线上线下电商用户数据挖掘研究

From:http://www.thebigdata.cn/JieJueFangAn/11932p2.html Online-to-Offline( 简称 O2O)电子商务模式,是一个连接线上用户和线下商家的多边平台商业模式. O2O 商业模式将实体经济与线上资源融合在一起,使网络成为实体经济延伸到虚拟世界的渠道; 线下商业可以到线上挖掘和吸引客源,而消费者可以在线上筛选商品和服务并完成支付,再到实体店完成余下消费. 它最先由 TrialPay 创始人 AlexRampell提出,在 2006

中华石杉 Spark大型项目实战:电商用户行为分析大数据平台138讲视频教程(项目实战)

38套大数据,云计算,架构,数据分析师,Hadoop,Spark,Storm,Kafka,人工智能,机器学习,深度学习,项目实战视频教程 视频课程包含: 38套大数据和人工智能精品高级课包含:大数据,云计算,架构,数据挖掘实战,实时推荐系统实战,电视收视率项目实战,实时流统计项目实战,离线电商分析项目实战,Spark大型项目实战用户分析,智能客户系统项目实战,Linux基础,Hadoop,Spark,Storm,Docker,Mapreduce,Kafka,Flume,OpenStack,Hiv

Spark大型项目实战:电商用户行为分析大数据平台

本项目主要讲解了一套应用于互联网电商企业中,使用Java.Spark等技术开发的大数据统计分析平台,对电商网站的各种用户行为(访问行为.页面跳转行为.购物行为.广告点击行为等)进行复杂的分析.用统计分析出来的数据,辅助公司中的PM(产品经理).数据分析师以及管理人员分析现有产品的情况,并根据用户行为分析结果持续改进产品的设计,以及调整公司的战略和业务.最终达到用大数据技术来帮助提升公司的业绩.营业额以及市场占有率的目标. 1.课程研发环境 开发工具: Eclipse Linux:CentOS 6

Spark项目之电商用户行为分析大数据平台之(九)表的设计

一.概述 数据设计,往往包含两个环节: 第一个:就是我们的上游数据,就是数据调研环节看到的项目基于的基础数据,是否要针对其开发一些Hive ETL,对数据进行进一步的处理和转换,从而让我们能够更加方便的和快速的去计算和执行spark作业: 第二个:就是要设计spark作业要保存结果数据的业务表的结构,从而让J2EE平台可以使用业务表中的数据,来为使用者展示任务执行结果. 二.MySQL表设计 2.1 session_aggr_stat表 存储第一个功能,session聚合统计的结果 CREATE

Spark项目之电商用户行为分析大数据平台之(十)IDEA项目搭建及工具类介绍

一.创建Maven项目 创建项目,名称为LogAnalysis 二.常用工具类 2.1 配置管理组建 ConfigurationManager.java 1 import java.io.InputStream; 2 import java.util.Properties; 3 4 /** 5 * 配置管理组件 6 * 7 * 1.配置管理组件可以复杂,也可以很简单,对于简单的配置管理组件来说,只要开发一个类,可以在第一次访问它的 8 * 时候,就从对应的properties文件中,读取配置项,

Spark项目之电商用户行为分析大数据平台之(十一)JSON及FASTJSON

一.概述 JSON的全称是”JavaScript Object Notation”,意思是JavaScript对象表示法,它是一种基于文本,独立于语言的轻量级数据交换格式.XML也是一种数据交换格式,为什么没 有选择XML呢?因为XML虽然可以作为跨平台的数据交换格式,但是在JS(JavaScript的简写)中处理XML非常不方便,同时XML标记比数据 多,增加了交换产生的流量,而JSON没有附加的任何标记,在JS中可作为对象处理,所以我们更倾向于选择JSON来交换数据.这篇文章主要从以下几个方

从零构建PHP商用MVC框架(2.1 路由-带参数请求)

本节我们就真正进入"从零构建php商用mvc框架"的实际动手阶段,本节的标题是"路由-带参数请求",我们本节要构建最基本的mvc路由访问控制,举例如:minyifei.cn/?_c=test&_a=getInfo 能访问我们的TestController类的getInfo方法,并能正常输出内容. 首先我给大家先看看最终的项目目录结构是什么样子的,然后再逐个文件介绍: 先看看index.php,大家都比较熟悉,这个是整个项目的入口,代码也很简单,仅做为转发器,

以太坊开发DApp实战教程——用区块链、星际文件系统(IPFS)、Node.js和MongoDB来构建电商平台(一)

第一节 简介 欢迎和我们一起来用以太坊开发构建一个去中心化电商DApp!我们将用区块链.星际文件系统(IPFS).Node.js和MongoDB来构建电商平台类似淘宝的在线电商应用,卖家可以自由地出售商品,买家可以自由地购物: 去中心化: 和淘宝或eBay不同,我们把所有的商业逻辑和核心数据都放在以太坊区块链上,这使 得它成为一个完全去中心化的应用.和淘宝这样中心化的电商平台相比,一个去中心化的P2P电商应用显然有其独特的价值--至少你不用担心被平台封账户了. IPFS: 在以太坊上存储用于商品