如何指标择优、综合?

  • 场景问题:

请教大家个问题~ 在工作中可能会有很多个指标来判断一个人或者访问的价值,例如时长,阅读的次数,曝光的次数,之类的很多个指标,那一般用什么算法或者办法去综合评判这个访问的价值。

  RFM模型,感觉这个可能更偏向于有购买行为的一些指标,app内的粘性指标感觉不知道怎么往这三个指标上套用。我找到了这个指标的对应,但是这个模型还有一个地方不太适用是 这个的主要目的是把人分成了几类, 但是我这里的想法其实有5-6个指标,然后通过这些指标直接给他们打一个总分。

  那对于这些评分指标,如何权重比较好呢?我就是在纠结这些问题。就是不是人为去拍定每个的权重,然后简单的去用权重当系数去加分,而是有什么算法可以去评判。 陈哲老师书里 是用变异系数,但我不知道,这样的话 ,对指标间的关系有没有要求

  现在用于分析的指标不是太少了,而是太多了。所以当指标很多时,我们就要思考这样几个问题:

1、在同类指标中如何选择更为有效的指标
2、如何得到反映用户价值的综合指标

概括起来,所面临的问题就是两个:择优和综合。

  • 如何择优呢?

  要看这项指标能否指导你的行动。

  比如,总用户数,PV,访问量这种,一般都会随着时间而增加,只会让企业自我感觉不错,而很难反映问题,像这种属于“虚荣指标”

  而相比总用户数,总活跃用户数会好一些,因为达到的难度增加了,但也是虚荣指标,也会随着时间而增加。

  那如果用总活跃用户数除以总用户数呢,是不是就要好很多,因为它反应了用户参与度,当版面或是产品作出调整,可以用它反映调整效果。显然如果调整的好,这个占比是要提升的。此外,像新用户增速可以对比不同流量渠道的效果。

  也就是,从诸多指标中你先要判断该指标是否是有价值的、可以有效帮你找到问题,衡量效果。分析的目的是为了找到可以落地改进的地方,因而找指标也要尽可能找可以衡量下手地方的指标。

  • 如何综合?

  综合的前提是要知道各项指标的联系。

  一种是因果联系。

  比如有些指标虽然很容易反映问题,比如最近一次购买的时间,或者说新近度,还有用户投诉量等,反映用户流失,如果用户很久没来了,或者用户说明用户可能会流失,但这种指标是“后见性指标”,是果。背后会有很多因素影响,你还需要继续找出反映这些因素的指标,比如有可能是页面不吸引人,反映在指标上可能就是用户停留时间短,或者若是电商,看看是哪个环节的转化率低。而在查找问题时,往往要有一个比较清晰的思维架构。

  比如,在《活用数据》的第8章第6节讲到流量渠道价值评价,就是从访客行为的流程和各指标的内在联系,从诸多指标中找出ROI和engagement作为衡量流量价值的指标。因为如果访客只访问,却很少浏览,或是只浏览不下单,对于企业来说都无法变现。所以不仅要关注访客访问的规模,还要关注其浏览互动,更要关注他的购买转化及所带来的收益。而ROI,从它的内涵出发,你会发现它能同时反映规模,转化和收益这三项因素,但是ROI它就没把互动综合进来。也就是在刚才说的我们需要关注的访客行为所对应的四个影响因素上,ROI能衡量三个,可以看成是反映访客规模,转化和收益的综合指标,但是互动衡量不了,所以用engagement衡量。所以总结起来就是,在评价流量价值时就要用ROI和互动两个大维度来同时衡量。

  但是,需要警惕的是我们所看到的指标,只是用户的痕迹,并不能反映用户的全部信息。所以这种因果关系并不一定能完全能反映到指标上。因此,不要妄想用算法解决一切,要多和销售业务人员沟通,要多进行自我体验。比如,有些电商网站在付款页面看不到或是改不了收件地址,可能就会引发跳出。如果把自己当成买家,多体验,即便没有指标也能发现问题。

  如果手头的指标有明显的先见性和后见性的区别,可以试试建立回归模型来做综合。

  

  

  另一种情况是同类指标。

  像问题中所列举的都是反映用户访问的一些指标,如果难以判断这些指标哪个更优,能不能综合,还有一个方法就是做主成份分析。主成份分析结果中的KMO和Bartlett球形检验就会告诉你,你放进去的这些指标之间有没有相关性,试想如果这些指标完全不相关,那就没有综合的必要了。

  接着主成份分析得到的特征根大于1的因子肯定会比原有的指标个数少,也就是主成份分析具有降维的作用,比如你原来有8个指标,通过主成份分析降成了2个因子,这2个因子其实就是原来8个指标的综合。

  如果你说,不行,我就要合成一个综合因子,然后用这个综合因子对研究对象进行排名,那你可以以各个因子的方差贡献率归一化作权重,对研究对象在各个因子上的得分做加权平均。

  如果要用算法来做RFM的权重,可以看表格中提到的变异系数法,最大熵,均方差,神经网络和回归。其实也可以做聚类。但提醒一点就是做这些分析之前要标准化,因为R、F、M的量纲是不同的。

  不要抵触主观设置权重的方法,尤其是RFM模型中,到底更看重金额,频次还是最近一次购买的时间,这是和企业所处阶段以、业务、商业模式有关的,比如刚创业的企业会更看重拉新,所以对F就要比对M更看重,而成熟企业则对M更看重一些。再比如卖洗发水和卖眼镜,用户的新近度肯定不一样,一个人的眼镜不会像洗发水买的那么勤,所以用主观来设置权重,把相关人员叫来,他们会带给你数据上看不到的业务常识和经验。

  RFM模型比较适合于to C类型的企业,尤其是日用消费品,因为如果是耐用消费品,R的跨度过大。所以像消费品,化妆品,小家电,超市,加油站,运输,快递,快餐店,电信等类似这些TO C的日用消费品应该都比较适合。

【参考】

【1】from 与陈哲老师的探讨总结

原文地址:https://www.cnblogs.com/zwt20120701/p/12700071.html

时间: 2024-10-30 04:27:02

如何指标择优、综合?的相关文章

股票各指标简介

原文地址:股票各指标简介作者:桃乐丝 1.  BDZX波段之星指令的操作明确. PAV   筹码引力 1.PAV上轨(GV)和下轨(CV)分别在0至100和-100至0区间内震动: 2.PAV-DIFF在高位大幅震荡表明主力建仓吸筹: 3.PAV-DIFF在低位持恒表明主力震仓洗盘: 4.PAV-DIFF由低位启动表明大行情发动的开始: 5.PAV-DIFF带量回落表明行情结束. NVI 负成交量 1.观察NVI 时,必须先设定一条平均线才能研判: 2.NVI 主要是追踪大户资金流向的指标: 3

见微知著——从《新闻联播》挖掘价值资讯擒拿年度政策受益牛股

中国交建操作案例图 中铁二局操作案例图 中铁二局政策受益后启动并飙涨 中国股市是一个政策导向的市场,无论是中国最早出名的股民“杨百万”还是目前控制市场走向的众多基金经理,都有一个共同的癖好—收看<新闻联播>,而<新闻联播>的价值甚至比上市公司的公告更值得研究,是字字都值得玩味的晴雨表. 滕国强 我不清楚大家是不是每天都有看新闻联播的习惯,反正我是每天都会观看,几乎每天都会出现热点,都用本子记录下,我相信在投资者所能获得的信息中,新闻联播可以说是最具有真实性.最不会欺骗投资者的信息,

运维监控大数据的提取与分析

本文内容整理来自[敏捷运维大讲堂]蒋君伟老师的线上直播分享.分别从以下3个维度来分享:1.云时代监控分析的窘境:2.使用标签标记监控数据的维度:3.监控数据应用场景. 云时代监控分析的窘境 在虚拟化与容器技术广泛应用的情况下,运维对象大规模地增长,监控平台每天存储的指标都以亿计,所以监控数据如今已经成了大数据.传统的监控工具在这种场景下,对于数据的提取分析,已经力不从心,反而成为了运维的负担. 我们用一个典型的互联网档案分析应用举例说明: 这个应用支持容灾与负载均衡,它部署在三个数据中心,并同时

主成分分析PCA详解

转载请声明出处:http://blog.csdn.net/zhongkelee/article/details/44064401 一.PCA简介 1. 相关背景 上完陈恩红老师的<机器学习与知识发现>和季海波老师的<矩阵代数>两门课之后,颇有体会.最近在做主成分分析和奇异值分解方面的项目,所以记录一下心得体会. 在许多领域的研究与应用中,往往需要对反映事物的多个变量进行大量的观测,收集大量数据以便进行分析寻找规律.多变量大样本无疑会为研究和应用提供了丰富的信息,但也在一定程度上增加

如何开展全网整合营销推广?

今天我们说说全网整合营销,随着公司发展,市场占有率的提升,单一的利用某些渠道获取用户,越来越接近天花板.还有一些公司希望在某个时间节点,利用市场的火热氛围(例如双11),达成市场推广目的.这都要求网络运营策略的制定者对全网推广有一定的了解.今天我们的主题是,全网整合营销推广的正确姿势. 一. 为什么要做全网整合营销 为什么会出现全网整合营销,核心在于用户在发生变化,对信息的掌控和沟通能力也比以往任何时代都强.不依赖于传统的信息提供者,任何人都可以利用网络自主搜寻信息,甚至产生信息.技术的发展使得

product(1.3)需求分析

之前讲过需求采集的事儿,需求采集了很多,但从哪里着手?用户帮我们想好了怎么做,照用户说的做吗? 关于这一点,<人人都是产品经理>的作者苏杰,用了这样一个title:听用户说但不要照着做. 1.明确我们的价值 对于采集的需求,首先要明确的知道,一个是用户需求,一个是产品需求,这中间的转化过程,就是这篇blog的主题--需求分析. 用户需求 VS 产品需求 用户需求:从用户采集到的.用户自以为的需求,并且经常表达为用户解决方案: 产品需求:经过分析,找到的真实需求,并且表达为产品解决方案: 需求分

u检验、t检验、F检验、X2检验 (转)

http://blog.renren.com/share/223170925/14708690013 常用显著性检验 1.t检验 适用于计量资料.正态分布.方差具有齐性的两组间小样本比较.包括配对资料间.样本与均数间.两样本均数间比较三种,三者的计算公式不能混淆. 2.t'检验 应用条件与t检验大致相同,但t′检验用于两组间方差不齐时,t′检验的计算公式实际上是方差不齐时t检验的校正公式. 3.U检验 应用条件与t检验基本一致,只是当大样本时用U检验,而小样本时则用t检验,t检验可以代替U检验.

2015互联网+影响力报告发布

2015年是中国“互联网+”元年,总书记在第二届世界互联网大会上提出构建全球网络空间命运共同体,要让互联网发展成果惠及13亿多中国人民,更好造福各国人民,并指出:“十三五”时期,中国将大力实施网络强国战略.国家大数据战略.“互联网+”行动计划,发展积极向上的网络文化,拓展网络经济空间,促进互联网和经济社会融合发展”.2015年3月李克强总理在政府工作报告首次提出“互联网+”行动计划,国务院连续印发<关于积极推进“互联网+”行动的指导意见>.<促进大数据发展行动纲要>以及大众创业.万

IEEE Spectrum 2014年十大编程语言盘点

近日,IEEE Spectrum推出 了一个最流行的编程语言排行榜.排行榜筛选了 12 项指标,综合了 10 个来源(含 IEEE Xplore.Google.GitHub)的数据,最终评选出了下面这个排行榜(满分 100,得分越高排名越靠前),其中的十大编程语言分别是: 1.    Java 2.    C 3.    C++ 4.    CNo. 5.    Python 6.    JavaScript 7.    PHP 8.    Ruby 9.    SQL 10.MATLAB 按照