训练贷款模型时样本、模型、监控的一些点

一.样本

理想情况下,样本分三部分。

训练样本70%

验证样本(有时也叫测试样本)30%

跨时间验证样本:但经常这块数据没有,那也就只用前面的数据来做也可以。

二.如何确保模型训练完成

1.训练样本的roc和ks达到比较好的水平(0.7,0.3及以上)

2.验证样本和训练样本的指标差距不大(如10%,也要根据ks和roc的绝对值来看)

3.跨时间验证样本和训练样本的指标差距不大(如10%,也要根据ks和roc的绝对值来看)

三.模型上线监控

变量稳定性

模型稳定性

模型ks

通过率、拒绝率、在各种被拒原因的统计

四.其它的一些名词

主要涉及到oot(跨时间验证)、时间窗口、观察期、表现期、vintage分析、Roll Rate分析(滚动率分析)、迁移率等概念。

vintage分析:不同时间的客户,某些逾期指标的比较,可以看出不同时间段的客户、政策、数据等的质量好坏。

滚动率分析:某一部分用户,他们逾期的转化的情况,从m0--m1,从m1--m2,从m2--m3等,分析用户还款特点。

有一个比较好的链接   Vintage、滚动率、迁移率的应用 在业务中要积极使用这些科学指标进行贷款业务的监测。

原文地址:https://www.cnblogs.com/ironan-liu/p/11405645.html

时间: 2024-08-24 23:13:25

训练贷款模型时样本、模型、监控的一些点的相关文章

用DPM(Deformable Part Model,voc-release3.1)算法在INRIA数据集上训练自己的人体检测模型

我的环境 DPM源码版本:voc-release3.1 VOC开发包版本:VOC2007_devkit_08-Jun Matlab版本:MatlabR2012b c++编译器:VS2010 系统:Win7 32位 learn.exe迭代次数:5万次 数据集:INRIA 人体数据集,等 步骤一,首先要使voc-release3.1目标检测部分的代码在windows系统下跑起来: 在Windows下运行Felzenszwalb的Deformable Part Models(voc-release4.

用DPM(Deformable Part Model,voc-release4.01)算法在INRIA数据集上训练自己的人体检测模型

步骤一,首先要使voc-release4.01目标检测部分的代码在windows系统下跑起来: 参考在window下运行DPM(deformable part models) -(检测demo部分) 步骤二,把训练部分代码跑通,在VOC数据集上进行测试,如下文: 在windows下运行Felzenszwalb的Deformable Part Model(DPM)源码voc-release3.1来训练自己的模型 但是其中的learn.cpp代码有误,其中319行check(argc == 8)通不

Java虚拟机内存模型及垃圾回收监控调优

Java虚拟机内存模型及垃圾回收监控调优 如果你想理解Java垃圾回收如果工作,那么理解JVM的内存模型就显的非常重要.今天我们就来看看JVM内存的各不同部分及如果监控和实现垃圾回收调优. JVM内存模型         正如你上图所看到的,JVM内存可以划分为不同的部分,广义上,JVM堆内存可以划分为两部分:年轻代和老年代(Young Generation and Old Generation) 年轻代(Young Generation) 年轻代用于存放由new所生成的对象.当年轻代空间满时,

Tensorflow中保存模型时生成的各种文件区别和作用

假如我们得到了如下的checkpoints, 上面的文件主要可以分成三类:一种是在保存模型时生成的文件,一种是我们在使用tensorboard时生成的文件,还有一种就是plugins这个文件夹,这个是使用capture tpuprofile工具生成的,该工具可以跟踪TPU的计算过程,并对你的模型性能进行分析,这里就不想详细介绍了.本文主要介绍前面两种文件的作用: tensorboard文件 events.out.tfevents.*...: 保存的就是你的accuracy或者loss在不同时刻的

Java 进阶(一) JVM运行时内存模型

1.JVM运行时数据区域的划分 a.程序计数器(Program Counter Register) 一块较小的内存空间,可以看作是当前线程所执行的字节码的行号指示器.每个线程拥有独立的一个计数器,如果当前执行的是Native方法,则计数器值为空. b.JVM栈(Java Virtual Machine Stack) 描述Java方法执行的内存模型,每个方法在执行的同时都会创建一个栈帧(Stacks Frame)用于存储局部变量表,操作数栈,动态链接,方法出口等信息. 每一个方法从调用直至执行完成

运行时内存模型

运行时内存模型运行时中,类型.对象.线程和托管对有相互的关系.CLR的一个windows进程,这个进程中可能存在多个现在.一个线程创建时,会分配1M的栈.这个栈主要用于方法传递实参和方法内部定义的局部变量.如果方法中有涉及到对象,则在堆中创建类型对象和类型实例.类型对象主要由类型对象指针.同步块索引.静态字段.方法列表组成.类型实例主要由类型对象指针.同步块索引.实例字段组成.其中类型实例的类型对象指针指向类型对象的类型对象指针.它们的相互关系如下图所示. 通过这张图,可以清楚了解运行时的内存由

dedecms(织梦)在后台新建新的模型时 ,点击编辑的时候 更新时间不能弹出

dedecms(织梦)在后台新建新的模型时 ,点击编辑的时候 更新时间不能弹出 ,分析了一下代码发现htm文件少了个js代码,其实很简单,我想dede官方也不会想到自己会写错. 解决办法 后台栏目默认是dede 那么就是/dede/templates/archives_edit.htm <td width="250"><?php $nowtime = GetDateTimeMk(time()); echo "<input name=\"pub

keras: 在构建LSTM模型时,使用变长序列的方法

众所周知,LSTM的一大优势就是其能够处理变长序列.而在使用keras搭建模型时,如果直接使用LSTM层作为网络输入的第一层,需要指定输入的大小.如果需要使用变长序列,那么,只需要在LSTM层前加一个Masking层,或者embedding层即可. from keras.layers import Masking, Embedding from keras.layers import LSTM model = Sequential() model.add(Masking(mask_value=

6、之前智骏40句语料合成实验,得到时长的HMM模型,替换40句自适应后的时长模型

实验目的: 吴老师认为HW2000-adapt-zhijun40-State10,实验结果的音速过快,比智骏40句的音速要快,所以像用智骏40句的时长模型,然后自适应后的频谱.基频参数,得到一个结果,看看怎么样? 实验过程: 新建一个路径:experimnet/Zhijun40-Syn labels(全部是从HW2000-adapt-zhijun40-State10/data/labels/路径下拷贝过来) full mono gen questions raw data/Makefile PR