基于数据分析的评分系统改进

现代互联网组织愈发依赖数据,收集反馈,以正确有效的决策。

本文以软件工程师的绩效考核为例,展现了如何通过数据分析,调整和改进量化的评分系统。

业务问题:

基于360度绩效考核方法,现代组织会设计问卷调查表,请被考核员工的同事客户针对多个问题进行打分,以得到该员工量化的绩效结果。

在实践中,这套方法遇到两个问题:

  1. 问卷调查问题的设计是否合理: 理想中,每个问题都应该相互独立,也就是问题1的结果不会对问题2造成影响。问卷表很难在第一个版本中就设计完备,设计问题本身也是一个基于反馈分析的迭代过程。
  2. 有时候,调查结果与经理的主观判断有差异。有经验的经理作为专家,其主观判断应该作为评价结果的重要输入。 那如何调整才能考虑经理判断的同时,又不失评分系统的公允呢?

工具选择:

我们有了某组织某年度所有员工的绩效评分数据,那选择什么数据分析工具呢?

  1. 这类业务问题的数据量通常不大,而且对分析结果的实时性要求也不强,所以没有必要使用Hadoop,Spark等平台;
  2. 中小量的非实时数据分析,工具有很多选择: Excel用的最多,初步的数据清理和呈现,Excel是很方便的。复杂些的分析,可以选择Python或R,Python作为通用语言,各平台对它的支持很好,像新浪的PaaS SAE可以直接支持Python;而R的库很全,基本可以覆盖所有的统计需求。

这个例子中,我们使用R。

分析过程和结论:

经过数据清洗,我们有了某组织某年度所有员工的绩效评分数据如下:

第一列是工程师名字,Average of Q1 到 Q5是该工程师在5个问题上得分的平均值,最后一列是该工程师最后的总分。

针对两个业务问题:

  1. 问卷调查问题的设计是否合理:

使用R中的cor()函数直接对由“Average of Q1 到 Q5”的5列构成的dataframe进行运算,可以得到这5列(5个问题)分数的相关性系数矩阵:

Average.of.Q1 Average.of.Q2 Average.of.Q3 Average.of.Q4 Average.of.Q5

Average.of.Q1     1.0000000      0.8800744        0.7240493        0.6420953          0.7840079

Average.of.Q2     0.8800744      1.0000000        0.7142950        0.7632830          0.8766518

Average.of.Q3     0.7240493      0.7142950        1.0000000        0.7035622          0.6683055

Average.of.Q4     0.6420953      0.7632830        0.7035622        1.0000000          0.8190740

Average.of.Q5     0.7840079      0.8766518        0.6683055        0.8190740          1.0000000

相关性系数越接近1,相关性越强。

由矩阵可以看出,Q1和Q2,Q2和Q5 相关性较强,由此,我们需要考虑更换Q2。

  1. 不失公允的专家调整

经理,作为专家应该发现系统潜在的不足,并进行调整。

以本绩效评分系统为例,每个组织都有绩效优良的考评,对总分在“重点线”之上的员工给与优良绩效。此例中“重点线”为60分,覆盖前30%的员工。

但每个组织都存在“老黄牛”型员工,他们任劳任怨,做了很多不出彩的脏活累活。他们很难得到同事客户在评分上的认可。然而,他们是组织中不可或缺的一份子,在绩效考核中需要考虑这个因素。

根据经理的日常观察,Anna,Jone,Barry,Neo是几位典型的“老黄牛”型员工。他们的总分分别为:Jone 58,Anna 55,Barry 54, Neo 53,平均为55分。

为了弥补评分系统本身的不足,也就是说要弥补“老黄牛”在“重点线”的竞争力,我们可以把“调剂线”设置到55分。对处于调剂线上的“老黄牛”可以酌情考虑其优良绩效。

通过R的density()函数,可以表达该组织中,每位员工绩效得分的分布和“调剂线”、“重点线”的关系。

如下图,通过分布曲线,“调剂线”和“重点线”刚好在分布上有“区分度”的两个区段。从另一个方面也说明了其合理性。

注意:“调剂线”的设置一定要不失公允。从统计上说,参与“调剂”的样本一定要少,本例中 <10%。 如果过多样本参与“调剂”,会对总体分布造成影响,使得系统的一些基本情况发生变化。

总结:

现代组织越发依赖数据进行决策,而数据决策系统本身也存在不断校准的过程。

本文就数据分析系统中的两个重要问题:问卷评分中问题的选择,和系统的专家调整,进行了分析和阐述,并结合R语言给出了分析的例子。

本文的思路和方法,适用于所有的数据分析系统改进,比如客户反馈评分系统 ,而不仅局限于员工绩效评分系统。

时间: 2024-10-31 07:00:46

基于数据分析的评分系统改进的相关文章

京东基于Spark的风控系统架构实践和技术细节

京东基于Spark的风控系统架构实践和技术细节 时间 2016-06-02 09:36:32  炼数成金 原文  http://www.dataguru.cn/article-9419-1.html 主题 Spark软件架构 1.背景 互联网的迅速发展,为电子商务兴起提供了肥沃的土壤.2014年,中国电子商务市场交易规模达到13.4万亿元,同比增长31.4%.其中,B2B电子商务市场交易额达到10万亿元,同比增长21.9%.这一连串高速增长的数字背后,不法分子对互联网资产的觊觎,针对电商行业的恶

评分卡系列(一):讲讲评分系统的构建

作者:JSong 时间:2017.12 我想通过几篇文章,给评分卡的全流程一个中等粒度的介绍.另外我的本职工作不是消费金融的数据分析,所以本系列的文章会偏技术一些. 数据分析工具主要有Python3及pandas.sklearn等科学计算包,另外也会有自己的工具包reportgen. 信用记录数据采用Lending Club的公开数据,特征数目和样本数都比较理想.大家可以到官网(www.lendingclub.com)下载,或者关注我的微信公众号后台回复:?数据集 ? 下载(含变量介绍和中文对照

商品信息数据分析及展现系统

基于数据挖掘技术的智能化数据分析系统设计与开发 潍坊物价信息数据分析及展现 背景: 商品价格和人们生活息息相关,比如农产品价格波动不仅会对农民收入和农民生产积极性产生直接影响,更关乎百姓的日常生活和切身利益.经常看新闻看到农民辛苦了一个季度的农作物全都烂在地里,因为价格太低廉,或者没有销路.虽然说物价波动是一种正常的经济现象,但是在一定程度上物价稳,人心才稳,社会才稳.为保持经济平稳健康发展.保障群众生活,稳定物价,信息公开显得尤为重要.价格监测和预测是维持物价稳定的一个重要环节.而对于商品价格

基于J2EE新闻发布系统的设计与实现——论文随笔(十四)

一.基本信息 标题:基于J2EE新闻发布系统的设计与实现 时间:2010-10 出版源:南昌大学 领域分类:系统架构和设计 二.研究背景 问题定义:很多企业都没重视前期的市场调查 , 导致许多低质量或者说是不符合要求的新闻发布系统出现 , 因此在建新闻发布系统前进行市场分析就显得更重要了 , 只有了解好企业所在的市场才能结合自身现状建设出高水准的新闻发布系统来 . 相关工作:本文提出开发一个新闻发布系统的想法 ,基于J2EE设计方法设计. 三.创新方法 1.all in one 的J2EE的设计

一个支持高网络吞吐量、基于机器性能评分的TCP负载均衡器gobalan

一个支持高网络吞吐量.基于机器性能评分的TCP负载均衡器gobalan 作者最近用golang实现了一个TCP负载均衡器,灵感来自grpc.几个主要的特性就是: 支持高网络吞吐量 实现了基于机器性能评分来分配worker节点的负载均衡算法 尽量做到薄客户端,降低客户端复杂性 项目开源地址 背景 先介绍几种常用的负载均衡机制,以下几种负载均衡方案介绍来自grpc服务发现&负载均衡 根据负载均衡实现所在的位置不同,通常可分为以下四种解决方案: 集中式LB(Proxy Model) 在服务消费者和服务

基于 OS X Mavericks 系统

基于 OS X Mavericks 系统远景论坛黑苹果区新手引导 常见疑难解答 以及必要知识普及帖 请善用论坛搜索功能 认真仔细地阅读置顶帖里的教程以及注意事项 前言:之前建立10.9区求助规范帖时,顺手写了新手普及帖,但总感觉信息不全,无法解决很多新手遇到的常见问题.所以今天抽出点时间,重新完善一下. 首先声明:置顶集合贴V4.3 是个相当好的帖子,也是我花很多心血在上面的帖子.而且这个帖子长期更新,很多问题,静下心来看一遍集合贴后,基本都能解决了.比起发帖询问干等着解答回帖,还不如先好好看看

基于Android2.3.5系统:Android.mk文件解析

*************************************************************************************************************************** 作者:EasyWave                                                                                                               时间:2

[转]建立大容量基于Web的Email系统

建立大容量基于Web的Email系统 王波 最近几年来,基于Web的免费Email系统非常流行.当前,几个著名的免费Email网站基本上已经成为大多数人的选择,建立单纯提供免费Email服务的站点不再像以前那样受到热烈欢迎,但是提供Web界面的Email服务已经成为了一个商业站点为其注册成员提供的基本服务之一. 一个Email系统可以分为服务器端和客户端,Web界面的Email系统则是将Email客户放在了Web服务器端,因此Email系统所需要实现的是一个Web界面的Email客户.然而,由于

基于Linux的OJ系统的设计与开发(一)

最近在研究基于linux的OJ系统,然后想自己写一系列文章记录自己这段时间的学习成果. 首先,从原理上讲,OJ功能实现并不难,最主要解决的是安全性问题.总结一下,而安全性方面问题主要是用户可能提交恶意不友好的代码.关于如何过滤这些不安全的代码,我从网上收集整理了许多资料,大体上思路如下: 先说错误的做法: 1.所有的字符串过滤都是不靠谱儿的,坑人坑自己,C语言强大的宏几乎没有绕不过的字符串过滤,而且误伤也是很常见的,比如,你在程序里要是不小心定义一个叫做fork的变量,那么你的程序别指望可以AC