大数据风控模型

基本流程:

数据收集、数据建模、构建数据画像、风险定价。

数据收集:网络行为数据、企业服务范围内行为数据、用户内容偏好数据、用户交易数据、授权数据源、第三方数据源、合作方数据源、公开数据源。

数据建模:文本挖掘、自然语言处理、机器学习、预测算法、聚类算法。

数据画像:基本属性、购买能力、行为特征、兴趣爱好、心理特征、社交网络。

风险定价:申请模型、行为监控模型、违约模型、催收策略模型。

目前国内90%以上的建模团队使用logistic回归做评分卡,少数使用决策树。

应用案例:

1、欺诈风险用到的模型:社会关系网络模型。

通过每笔案件之间的关系,判断新案件是欺诈申请的可能性。

2、信用风险主要用到的模型:logistic回归建立评分卡。

量化新申请人可能违约的概率,根据评分高低制定不同的授信规则和催收策略。

3、贷后管理用到的模型:也是行为评分卡。

例如额度调整和客户风险分池管理等。

注意:

用户数据需要进行规整处理,转化为相同维度的特征向量,然后算法才能派上用场。

对于结构化数据而言,特征提取工作往往都是从给数据打标签开始的。比如购买渠道,年龄性别等等。

对于已经打好的标签,根据不同的分析场景进行离散化,或将分类类型的标签拆成多个0/1标签,就可以进行一些机器学习的建模,比如聚类、分类、预测、关联性分析,最终生成的向量维度在数千个。

实际建模案例:http://blog.csdn.net/l18930738887/article/details/50662900

时间: 2024-08-01 15:28:45

大数据风控模型的相关文章

大数据风控质量好不好?从这几点来看

大数据风控从出世以来一直是资本关注的重点,市面上不仅有很多互联网金融公司开发了大数据风控模型,还有很多专门做大数据风控技术然后向业界输出技术能力的公司.然而,白热化的市场竞争中必然伴随着良莠不齐泥沙俱下的产品.虽然极高的技术壁垒,可靠安全的数据来源,形成了天然屏障把浑水摸鱼的产品隔离开来,但是对于那些不甚懂技术的人来说,一眼甄别大数据风控产品的成色是好还是坏还需要花不少时间. 风险控制作为金融的核心,一直备受关注.在传统金融机构中,会通过一些基础的金融逻辑来推断风险.比如收入水平越高偿还能力越高

互联网金融做大数据风控的九种维度

在互联网金融迅猛发展的背景下,风险控制问题已然成为行业焦点,基于大数据的风控模型正在成为互联网金融领域的热门战场.那么,大数据风控到底是怎么一回事呢?与传统风控相比,它又是怎样来进行风险识别的呢?本文对此进行了探讨. 大数据能够进行数据变现的商业模式目前就是两个,一个是精准营销,典型的场景是商品推荐和精准广告投放,另外一个是大数据风控,典型的场景是互联网金融的大数据风控. 金融的本质是风险管理,风控是所有金融业务的核心.典型的金融借贷业务例如抵押贷款.消费贷款.P2P.供应链金融.以及票据融资都

维信小贷发布“蜂鸟”大数据风控云平台

11月23日,上海首届中国普惠金融创新发展论坛上,维信小贷公司发布了自主研发.专门针对普惠金融及小额信贷领域的“蜂鸟”大数据金融云平台,维信理财集团首席技术官金家芳做了详细介绍和解读.    自2005年联合国与世界银行提出并推行“普惠金融”以来,虽然近几年我国小额贷款.P2P机构在普惠金融领域获得快速发展,然而普遍存在缺乏数据积累.风控技术及风控能力不足的挑战.当前,各类普惠金融服务机构绝大多数仍然采用传统的线下人工审核机制,面对小额.分散.快速的业务特征,难以获取和整合分析客户多维度信息,实

大数据运算模型 MapReduce 原理

大数据运算模型 MapReduce 原理 2016-01-24 杜亦舒 MapReduce 是一个大数据集合的并行运算模型,由google提出,现在流行的hadoop中也使用了MapReduce作为计算模型 MapReduce 通俗解释 图书馆要清点图书数量,有10个书架,管理员为了加快统计速度,找来了10个同学,每个同学负责统计一个书架的图书数量 张同学 统计 书架1王同学 统计 书架2刘同学 统计 书架3...... 过了一会儿,10个同学陆续到管理员这汇报自己的统计数字,管理员把各个数字加

大数据风控案例(总结他人)

转自于:http://blog.csdn.net/liberty_xm/article/details/53185252 一.行业背景 1.1风控行业背景 当前,经济下行导致中小企业经营成本不断增加吗,产品销售价格因结构原因和市场原因相对走低,企业利润空间被进一步压缩,许多中小企业陷入经营困境,导致企业经营风险加大.连锁性风险陡增.潜在信用风险上升.企业主的道德风险聚升.一些重点领域的银行等金融机构信贷风险进入了一个暴露期,一些地区的金融机构已经出现不良贷款回升苗头,不良贷款高危行业中,钢铁与建

消费金融大数据风控架构

1.1 信用风险 根据银行业的风险理论,信用风险是指借款人因各种原因未能及时.足额偿还债权人或银行贷款而违约的可能性. 信用风险的风控重点在于,甄别客户违约的原因究竟是还款能力,还是还款意愿问题.如果客户真的由于各方面的原因,暂时不具备还款能力,这是概率问题.即使发生了,处置起来也不会有什么损失.而如果是还款意愿问题,存在较大的资金损失概率. 1.2 欺诈风险 在风控中,欺诈风险比信用风险要大得多,所以反欺诈是重中之重.一般来说正常的客户,如果不是刻意骗贷的,只是因为家里出现突发事故.生意出现问

大数据内存模型(二级指针)

#define _CRT_SECURE_NO_WARNINGS #include <stdio.h> #include <stdlib.h> #include <string.h> #include <Windows.h> #include <memory.h> #define path "E:\\杂乱test\\内存大数据模型\\1E~001.txt" char **g_pp; int imax = 8435714;//标识

大数据、AI“武装”企业服务:风控、检索、安全

大数据.AI"武装"企业服务:风控.检索.安全 小饭桌创业课堂2017-05-06 15:26:42阅读(127)评论(0) + - 文|吴杨可月 - - 小饭桌创业研究院出品 - 两件秘闻,将美国大数据公司Palantir从幕后推向前台-- 一是,Palantir的旗下产品在整合40年的记录及海量数据并充分挖掘之后,找到了前纳斯达克主席麦道夫"庞氏骗局"的大量确凿证据: 二是,通过其大数据挖掘能力,Palantir帮美国政府找到本拉登的老巢. 人们这才惊叹的发现,

【ArchSummit干货分享】个推大数据金融风控算法实践

作者:个推高级数据工程师 晓骏 众所周知,金融是数据化程度最高的行业之一,也是人工智能和大数据技术重要的应用领域.随着大数据收集.存储.分析和模型技术日益成熟,大数据技术逐渐应用到金融风控的各个环节.个推作为专业的数据智能服务商,拥有海量数据资源,在智慧金融领域也推出了相应的数据解决方案-个真,为金融客户提供智能反欺诈.多维信贷风险评估和高意愿用户智能筛选等全流程的数据服务,助力各金融机构全面提升风控能力.本文将围绕大数据风控,结合个推实践,介绍金融风控机器学习的基本流程.算法实践和产品化建设等