风控建模之性能评估

目录

  • 1 KS
  • 2 GINI
  • 3 知识拓展
  • 4 思考

?

建模完成后的下一步,就是对模型性能进行评估,常用指标有:

  • KS:关注的是一个点(好坏差异最大的点),要结合取到最大KS的评级点综合评估模型
  • GINI:关注的是一个面,是一个积分的概念,对模型的评估实际上比KS更全面一些

?

1 KS

在看模型性能报告时,除了KS,还有一个非常重要的指标:在哪一个评级KS取到最大,这会给模型应用带来差异。因为同样的KS,有的模型在高分段区分效果特别好,有的模型在低分段区分效果特别好,但通常而言,银行更关注的是坏客户(低分段客户)。

综上,模型的应用和银行业务偏好有很大关联,所以在评估模型性能时,除了看KS指标,还要看好坏客户分布,是在什么时候取到KS最大值。

?

2 GINI

GINI对模型的评估实际上比KS更全面一些,当两个模型KS一样,可以比较两者的GINI,谁的GINI更大,则这个模型性能更好。

?

3 知识拓展

1. Perf中的20组的分组依据是什么?

其实相当于模型评分的基础上做了等频分箱。

2. 有时会遇到好坏客户比率不单调,造成原因是什么,如何处理这种问题?

在做34组的分布时,两头的客户量会比较少,这时随机因素影响比较大,就有可能导致34级的分布不单调。因为模型是基于数据驱动,完全有可能遇到这种情况,属于正常现象,只要保证在客户分布密集的区域是单调的就行。

?

4 思考

  • 如果两个模型KS一样,是否就认为两个模型性能完全一样?
  • 如何全面评估模型性能?

原文地址:https://www.cnblogs.com/1k-yang/p/12620110.html

时间: 2024-10-21 00:47:29

风控建模之性能评估的相关文章

[下篇] 一篇文章详解性能评估难点

在这个娱乐明星频频出轨.奇葩热文爆炸的时代,你却能抽空关注IT技术,请为你这份难能可贵和对技术的执着点个赞吧!请搜索"ICT_Architect"关注微信公众号,获取更多精彩内容. 在上篇文章[收藏] 深入浅出存储性能评估方法论中,我们介绍了性能评估相关概念和原理,但是在项目实战中,要根据业务真实诉求给出切合实际的性能配置,还需要针对业务模型进行最佳实践分析和洞察,从主机端口.存储系统.后端磁盘等端到端进行分析和评估,在本文中把常见的性能评估过程中的难点依次罗列,希望对大家有所帮助.

Linux服务器性能评估与优化(一)

网络内容总结(感谢原创) 1.前言简介 一.影响Linux服务器性能的因素 1. 操作系统级 性能调优是找出系统瓶颈并消除这些瓶颈的过程. 很多系统管理员认为性能调优仅仅是调整一下内核的参数即可解决问题, 事实上情况并不是这样. 性能调优是实现操作系统的各个子系统之间的平衡性,这些子系统包括: ?       CPU ?       内存 ?       磁盘I/O带宽 ?       网络I/O带宽 子系统之间相互依存,任何一个子系统的负载过度都能导致其他子系统出现问题,例如: * 大量的 p

机器学习:模型性能评估与参数调优

模型性能评估的常用指标 真阳性(True Positive,TP):指被分类器正确分类的正例数据 真阴性(True Negative,TN):指被分类器正确分类的负例数据 假阳性(False Positive,FP):被错误地标记为正例数据的负例数据 假阴性(False Negative,FN):被错误地标记为负例数据的正例数据 精确率=TP/(TP+FP),TP+FP是模型预测的正样本总数,精确率衡量的是准确性: 召回率=TP/(TP+FN),TP+FN是真实的正样本总数,召回率衡量的是覆盖率

常用机器性能评估工具

杨海春,曾在从兴技术有限公司担任主要设计开发岗,熟悉移动计费系统整体系统架构.目前就职于腾讯计算机系统有限公司,担任工程师职位,熟悉日志计费系统,离线计算等场景. 软件系统跑在机器上,处理能力受硬件制约,所以,单机处理能力会有上限.评估机器处理能力的上限,检查程序的瓶颈在哪,有助于程序性能分析. 主要的几大硬件:CPU.内存.网络.磁盘.本文主要结合本人经验介绍这几大硬件的性能评估工具. 1.CPU性能评估 1.1 vmstat 工具 使用举例: vmstat 1 10 第一个参数:采样频率 第

性能评估思路总体

性能评估设计步骤: 1.陈述目标,定义系统.确定所设定的目标,建立软硬件系统,设定边界 2.列出所提供的服务和产出. 3.选择指标.通常这些指标与速度.准确度.可靠性有关. 4.列出变量.这一步列出有关影响性能的所有的变量,这列出第一遍的变量之后,好好再分析一下,再添加有关的其他变量,这些变量尽可能通俗易懂. 5.选择因素来研究.在小4中列出的变量分为在性能分析中可变和不变量,我们把这些可变量叫做因素,还有把那些不可变但是对于性能影响较大的变量也叫做因素,也就是说影响到性能分析的变量,我们都可以

转贴---Linux服务器性能评估

http://fuliang.iteye.com/blog/1024360 http://unixhelp.ed.ac.uk/CGI/man-cgi?vmstat -------------------------------------------------------------------------------------------------------------------------------- 工作这么久了,主要就是服务器端的开发,由于业务性质,对于性能的考虑是每天不得不

linux性能评估与分析工具

linux是一个开源系统,其内核负责管理系统的进程,内存,设备驱动程序,文件和网络系统, 决定着系统的性能和稳定性.由于内核源码很容易获取,任何人都可以将自己认为优秀的代码 加入到其中.linux默认提供了很多服务,如何发挥linux的最大性能,如何精简系统以便适合 当前的业务需求,这需要对内核进行重新编译优化.影响linux性能的因素有很多,从底层硬件 到上层应用,每一部分都可以有优化的地方. linux性能评估与分析工具 影响linux服务器性能的因素有很多,从底层的硬件到操作系统,从网络应

模型的性能评估(二) 用sklearn进行模型评估

在sklearn当中,可以在三个地方进行模型的评估 1:各个模型的均有提供的score方法来进行评估. 这种方法对于每一种学习器来说都是根据学习器本身的特点定制的,不可改变,这种方法比较简单.这种方法受模型的影响, 2:用交叉验证cross_val_score,或者参数调试GridSearchCV,它们都依赖scoring参数传入一个性能度量函数.这种方法就是我们下面讨论的使用scoring进行模型的性能评估. 3:Metric方法,Metric有为各种问题提供的评估方法.这些问题包括分类.聚类

Linux服务器性能评估

一.影响Linux服务器性能的因素 1. 操作系统级 CPU 内存 磁盘I/O带宽 网络I/O带宽 2. 程序应用级 二.系统性能评估标准 影响性能因素 影响性能因素 评判标准 好 坏 糟糕 CPU user% + sys%< 70% user% + sys%= 85% user% + sys% >=90% 内存 Swap In(si)=0Swap Out(so)=0 Per CPU with 10 page/s More Swap In & Swap Out 磁盘 iowait %