零售业CLV客户价值模型

赶在2017年的尾巴,终于把几个模型做完并进入部署阶段,开心之余想到好久没更新我的小白数据分析师的文章啦~赶紧来补个功课!

关于CLV客户价值模型,其实本质就是想回答2个业务人员关心的问题:
(1)    这个客户已经为企业创造了多少价值?回答:客户X过去n年内消费XX元
(2)    这个客户将来会为企业创造多少价值?回答:客户X未来n年内将消费XX元
       故而,CLV模型首先被拆成了两个部分:一是CCV客户当前价值模型;二是CPV客户潜在价值模型。

模型框架:
(一)    Customer Current Value 客户当前价值模型
       当前价值即衡量一个客户到目前为止为企业带来的收益及利润现值,这个相对来说比较好计算,这里为了便于BS人员使用,我们也支持了分品牌分渠道的计算。
(二)    Customer Potential Value 客户潜在价值模型
       潜在价值模型是基于客户当前客户关系和消费模式,衡量一个客户(用户)在未来一段时期内可能为企业带来的收益。
       在前期的数据探索阶段,我了解到BS的客户每年的留存率并不高,例如2016年发生交易的客户里仅有约20%的客户2017年也会发生交易,这便为我们提出一个问题:是否应考虑先进行客户下期是否发生购买的预测?
       于是,在潜在价值模型里我会进行两个预测:一是下期购买概率的预测,二是客户潜在价值区间的预测。这样两个指标的呈现也能更好地帮助业务人员进行人群筛选。
       至此,完整的CLV模型如下图所示——

具体思路:
(一) CCV客户当前价值模型:直接进行数据计算,不再赘述
(二) CPV客户潜在价值模型:
(1)    模型数据选取
       有关数据选取,在咨询了组里的服装行业专家小津姐和自己的多次尝试后,我使用了以下4个方向的特征数据:属性特征,交易行为特征,品类特征及季度特征。如下表所示,

这里值得一提的是,之前的模型中并未使用过品类特征和季度特征,然而在服装行业,客户明年购买与否和他之前在该品牌买的品类是高度相关的,例如买袜子的客户黏性就会偏低,因为袜子的可替代性太强,不一定要在这个品牌继续购买。至于季度特征,服装行业的季度差异性是较大的,例如客户可能仅对秋冬季服装感兴趣。于是,在属性特征和交易行为特征之外,我加入了每个客户历史上购买各个品类服装的数量以及各个季度的服装数量作为特征。

(2)    模型设计及训练
       活跃客户和非活跃客户的差异性很大,会员库里几年前一直未交易的客户其实往往已经永久流失,所以在训练模型之前我们需要了解每年交易客户的构成是怎么样的。于是,我对2017年发生交易的客户组成进行了分析。

基于上图,我们可以发现,除了2017年的新客户,红框中的3类客户是我们可以来进行预测的。于是,我将全量的VIP客户划分为3大类,并加以不同的预测方法,如下图所示。

(3)    模型结果

  • CPV客户下期购买概率模型

由于我们关注的是把会购买的人预测出来,所以在二分类器的阈值选择上,我们选择了0.45作为阈值,此时的正样本Recall率约70%,即我们能预测出来70%会购买的人。
       此外,也有不少负样本会被误判成正样本,但是从逻辑上来将,这些负样本客户的购买与否随机性太强,但是他们的购买概率高即证明他们与下期购买的人群是十分相似的。从业务上来讲,若是能正确有效地触达他们,是有很大可能性使他们发生购买。
       当然,在上述结果之外,我们还可以看到一些业务非常感兴趣的输出。例如,基于下面的特征重要性表和一些相关性统计结果,我们发现影响客户下期购买与否的因素中除了常见的交易行为特征,有不少是品类特征,如GRANDCAT_9,GRANDCAT_4和GRANDCAT_2。

举一个简单的例子,某一个女装品牌,其明星产品便是连衣裙,结合数据结果,我们也确实购买发现连衣裙的客户黏性更高,即这些客户的下期购买概率高。而另一个男装品牌,则是购买风衣和长裤的客户黏性更高。
        此外,为了便于业务人员使用,我将区间做成了4档,便于他们进行标签筛选。

  • CPV客户潜在价值模型

这里模型是直接预测到价值区间,最后的误差率维持在30%左右,这里我们也支持分品牌的计算客户的潜在价值。

至此,对于每一个客户,我们将形成完整的CLV模型预测结果。

(4)   模型应用

  • CPV客户下期购买概率模型

1. 业务人员可以通过不同的区间选择达到更多地筛选会购买人群或更准地筛选会购买的人群
例如,

2.各品牌还可以根据特征重要性,更加了解自己的客户明星产品集中在什么品类。

  • CPV客户潜在价值模型

1. 业务人员可以结合下期购买概率和价值区间更好地筛选人群。业务人员可以先筛选购买概率高的人群再选择所需要的价值区间的人群。
例如,一个针对高端的小范围活动,可以筛选高购买潜力和高潜在价值的人群。
2. 业务人员可以结合客户当前价值CCV和客户潜在价值CPV来进行差异性营销。

原文地址:https://www.cnblogs.com/pengjia/p/8146003.html

时间: 2024-10-02 20:24:46

零售业CLV客户价值模型的相关文章

CRM——零售业客户价值挖掘利器

网络时代在搜索成本越来越低的情况下,网络上的海量信息让客户拥有了足够分辨能力并能迅速做出决定--在一秒钟内选择或放弃某个零售品牌的商品,或在下一秒钟再更换成另一家零售品牌.品牌一点点的偏差就有可能流失客户. 对此,品牌不要短视地看待客户今天的购买行为.购买数量和支付金额.要用忠诚度牢牢地拴住那些有价值的或具潜在价值的客户,提高他们对品牌的满意度和忠诚度,尽可能延长客户的生命周期,最终实现客户价值的倍增. 莎士比亚说,"闪光的不一定都是金子".同样,客户也不一定都是属于你的上帝.一项研究

Python使用RMF聚类分析客户价值

投资机构或电商企业等积累的客户交易数据繁杂.需要根据用户的以往消费记录分析出不同用户群体的特征与价值,再针对不同群体提供不同的营销策略. 用户分析指标 根据美国数据库营销研究所Arthur Hughes的研究,客户数据库中有三个神奇的要素,这三个要素构成了数据分析最好的指标 R-最近一次消费(Recency) F-消费频率(Frequency) M-消费金额(Monetary) 通过该图将用户进行分类: R.F.M都很高,重要价值客户(VIP客户) F.M很高,R不高,重要保持客户 R.F.M都

最近一个项目的一点反省:客户价值才是关注的焦点

我们公司的一款PC软件,是对各种波形数据文件进行解析.显示.最近的一次开发,采用敏捷的方法进行,每次迭代验收都严格执行单体测试的全面性确认.本次开发的内容是追加一种新的波形数据文件解析,因此这个项目的主要输出是文件解析的DLL,但是针对新文件数据的显示,也是项目内容之一,只是因为显示功能已比较完善,预想不会占有太多的时间. 但最后问题就出在这个预想上.最终结果,6K的程序中共出现了9件Bug(第三方确认测试中发现的),而这些Bug几乎全部出现在显示和显示后的文件保存上. 为什么会出现这样的问题?

创业公司怎样靠解锁客户价值链成功

无论是优步还是爱彼迎,近几年的明星创业公司的一大共同点是,他们靠着打破某个行业的原有规则获得成功.哈佛商学院副教授泰丽斯·特谢拉(Thales Teixeira)通过6年的分析调查提出,这些公司商业模式的基本原理叫做脱钩(decoupling).在她的新书<解锁客户价值链:脱钩如何动摇消费者决策>(Unlocking the Customer Value Chain:How Decoupling Drives Consumer Disruption)中,特谢拉解释了"脱钩"

用Mirror,搞定用户画像

Mirror产品概述 Mirror是专为金融行业设计的全面用户画像管理系统.该系统基于星环多年来为多个金融企业客户构建用户画像的经验,深入契合业务需求,实现对用户全方位全维度的刻画.Mirror内置银行业和证券业的用户画像模板,同时在技术上继承了Transwarp Data Hub大数据平台的优势,能够快速在全量数据上进行计算和提供查询.同时,Mirror采用了灵活的接口设计,可以方便地进行二次开发和对接其它应用. Mirror产品特点 构造金融客户的信息生态系统,支持跨业务,跨产品的精准客户群

数据挖掘应用案例:RFM模型分析与客户细分(转)

正好刚帮某电信行业完成一个数据挖掘工作,其中的RFM模型还是有一定代表性,就再把数据挖掘RFM模型的建模思路细节与大家分享一下吧!手机充值业务是一项主要电信业务形式,客户的充值行为记录正好满足RFM模型的交易数据要求. 根据美国数据库营销研究所Arthur Hughes的研究,客户数据库中有三个神奇的要素,这三个要素构成了数据分析最好的指标:最近一次消费(Recency).消费频率(Frequency).消费金额(Monetary). 我早期两篇博文已详述了RFM思想和IBM Modeler操作

5种网络IO模型(有图,很清楚)

同步(synchronous) IO和异步(asynchronous) IO,阻塞(blocking) IO和非阻塞(non-blocking)IO分别是什么,到底有什么区别?这个问题其实不同的人给出的答案都可能不同,比如wiki,就认为asynchronous IO和non-blocking IO是一个东西.这其实是因为不同的人的知识背景不同,并且在讨论这个问题的时候上下文(context)也不相同.所以,为了更好的回答这个问题,我先限定一下本文的上下文. 本文讨论的背景是Linux环境下的n

互金时代如何定制个性化信用评分模型

互金时代如何定制个性化信用评分模型 相比起传统金融机构,互联网金融以个性化服务取胜,由此也催生了各类深耕细分市场的互联网金融公司.不过这样一来,原来传统风控的玩法和经验,已经很难满足新兴互联网金融公司的风控需求. 如何用最为省时省力的方法,打造契合自身业务特色的个性化风控模型?如何利用先进的大数据手段,迅速提高风控的效率,降低风控的成本?今天就让处座来介绍一下吧. 风控将成互联网金融发展"痛点" 在经历2013至2014年的爆发式发展之后,互联网金融行业逐渐步入到规范化发展阶段.201

网络服务器架构模型与比较

事件驱动为广大的程序员所熟悉,其最为人津津乐道的是在图形化界面编程中的应用:事实上,在网络编程中事件驱动也被广泛使用,并大规模部署在高连接数高吞吐量的服务器程序中,如 http 服务器程序.ftp 服务器程序等.相比于传统的网络编程方式,事件驱动能够极大的降低资源占用,增大服务接待能力,并提高网络传输效率. 关于本文提及的服务器模型,搜索网络可以查阅到很多的实现代码,所以,本文将不拘泥于源代码的陈列与分析,而侧重模型的介绍和比较.使用 libev 事件驱动库的服务器模型将给出实现代码. 本文涉及