训练贷款模型时样本、模型、监控的一些点

一.样本

理想情况下，样本分三部分。

训练样本70%

验证样本（有时也叫测试样本）30%

跨时间验证样本：但经常这块数据没有，那也就只用前面的数据来做也可以。

二.如何确保模型训练完成

1.训练样本的roc和ks达到比较好的水平（0.7,0.3及以上）

2.验证样本和训练样本的指标差距不大（如10%，也要根据ks和roc的绝对值来看）

3.跨时间验证样本和训练样本的指标差距不大（如10%，也要根据ks和roc的绝对值来看）

三.模型上线监控

变量稳定性

模型稳定性

模型ks

通过率、拒绝率、在各种被拒原因的统计

四.其它的一些名词

主要涉及到oot（跨时间验证）、时间窗口、观察期、表现期、vintage分析、Roll Rate分析（滚动率分析）、迁移率等概念。

vintage分析：不同时间的客户，某些逾期指标的比较，可以看出不同时间段的客户、政策、数据等的质量好坏。

滚动率分析：某一部分用户，他们逾期的转化的情况，从m0--m1,从m1--m2,从m2--m3等，分析用户还款特点。

有一个比较好的链接 Vintage、滚动率、迁移率的应用在业务中要积极使用这些科学指标进行贷款业务的监测。

原文地址：https://www.cnblogs.com/ironan-liu/p/11405645.html

时间： 2024-11-09 21:31:06

训练贷款模型时样本、模型、监控的一些点的相关文章

用DPM(Deformable Part Model，voc-release3.1)算法在INRIA数据集上训练自己的人体检测模型

我的环境 DPM源码版本:voc-release3.1 VOC开发包版本:VOC2007_devkit_08-Jun Matlab版本:MatlabR2012b c++编译器:VS2010 系统:Win7 32位 learn.exe迭代次数:5万次数据集:INRIA 人体数据集,等步骤一,首先要使voc-release3.1目标检测部分的代码在windows系统下跑起来: 在Windows下运行Felzenszwalb的Deformable Part Models(voc-release4.

用DPM(Deformable Part Model，voc-release4.01)算法在INRIA数据集上训练自己的人体检测模型

步骤一,首先要使voc-release4.01目标检测部分的代码在windows系统下跑起来: 参考在window下运行DPM(deformable part models) -(检测demo部分) 步骤二,把训练部分代码跑通,在VOC数据集上进行测试,如下文: 在windows下运行Felzenszwalb的Deformable Part Model(DPM)源码voc-release3.1来训练自己的模型但是其中的learn.cpp代码有误,其中319行check(argc == 8)通不

Java虚拟机内存模型及垃圾回收监控调优

Java虚拟机内存模型及垃圾回收监控调优如果你想理解Java垃圾回收如果工作,那么理解JVM的内存模型就显的非常重要.今天我们就来看看JVM内存的各不同部分及如果监控和实现垃圾回收调优. JVM内存模型正如你上图所看到的,JVM内存可以划分为不同的部分,广义上,JVM堆内存可以划分为两部分:年轻代和老年代(Young Generation and Old Generation) 年轻代(Young Generation) 年轻代用于存放由new所生成的对象.当年轻代空间满时,

Tensorflow中保存模型时生成的各种文件区别和作用

假如我们得到了如下的checkpoints, 上面的文件主要可以分成三类:一种是在保存模型时生成的文件,一种是我们在使用tensorboard时生成的文件,还有一种就是plugins这个文件夹,这个是使用capture tpuprofile工具生成的,该工具可以跟踪TPU的计算过程,并对你的模型性能进行分析,这里就不想详细介绍了.本文主要介绍前面两种文件的作用: tensorboard文件 events.out.tfevents.*...: 保存的就是你的accuracy或者loss在不同时刻的

Java 进阶（一） JVM运行时内存模型

1.JVM运行时数据区域的划分 a.程序计数器(Program Counter Register) 一块较小的内存空间,可以看作是当前线程所执行的字节码的行号指示器.每个线程拥有独立的一个计数器,如果当前执行的是Native方法,则计数器值为空. b.JVM栈(Java Virtual Machine Stack) 描述Java方法执行的内存模型,每个方法在执行的同时都会创建一个栈帧(Stacks Frame)用于存储局部变量表,操作数栈,动态链接,方法出口等信息. 每一个方法从调用直至执行完成

运行时内存模型

运行时内存模型运行时中,类型.对象.线程和托管对有相互的关系.CLR的一个windows进程,这个进程中可能存在多个现在.一个线程创建时,会分配1M的栈.这个栈主要用于方法传递实参和方法内部定义的局部变量.如果方法中有涉及到对象,则在堆中创建类型对象和类型实例.类型对象主要由类型对象指针.同步块索引.静态字段.方法列表组成.类型实例主要由类型对象指针.同步块索引.实例字段组成.其中类型实例的类型对象指针指向类型对象的类型对象指针.它们的相互关系如下图所示. 通过这张图,可以清楚了解运行时的内存由

dedecms（织梦）在后台新建新的模型时，点击编辑的时候更新时间不能弹出

dedecms(织梦)在后台新建新的模型时 ,点击编辑的时候更新时间不能弹出 ,分析了一下代码发现htm文件少了个js代码,其实很简单,我想dede官方也不会想到自己会写错. 解决办法后台栏目默认是dede 那么就是/dede/templates/archives_edit.htm <td width="250"><?php $nowtime = GetDateTimeMk(time()); echo "<input name=\"pub

keras: 在构建LSTM模型时，使用变长序列的方法

众所周知,LSTM的一大优势就是其能够处理变长序列.而在使用keras搭建模型时,如果直接使用LSTM层作为网络输入的第一层,需要指定输入的大小.如果需要使用变长序列,那么,只需要在LSTM层前加一个Masking层,或者embedding层即可. from keras.layers import Masking, Embedding from keras.layers import LSTM model = Sequential() model.add(Masking(mask_value=

6、之前智骏40句语料合成实验，得到时长的HMM模型，替换40句自适应后的时长模型

实验目的: 吴老师认为HW2000-adapt-zhijun40-State10,实验结果的音速过快,比智骏40句的音速要快,所以像用智骏40句的时长模型,然后自适应后的频谱.基频参数,得到一个结果,看看怎么样? 实验过程: 新建一个路径:experimnet/Zhijun40-Syn labels(全部是从HW2000-adapt-zhijun40-State10/data/labels/路径下拷贝过来) full mono gen questions raw data/Makefile PR