消费金融大数据风控架构

1.1 信用风险

根据银行业的风险理论,信用风险是指借款人因各种原因未能及时、足额偿还债权人或银行贷款而违约的可能性。

信用风险的风控重点在于,甄别客户违约的原因究竟是还款能力,还是还款意愿问题。如果客户真的由于各方面的原因,暂时不具备还款能力,这是概率问题。即使发生了,处置起来也不会有什么损失。而如果是还款意愿问题,存在较大的资金损失概率。

1.2 欺诈风险

在风控中,欺诈风险比信用风险要大得多,所以反欺诈是重中之重。一般来说正常的客户,如果不是刻意骗贷的,只是因为家里出现突发事故、生意出现问题、暂时失业等等原因而导致资金周转不过来而逾期的,这毕竟是少数,而且借款只是逾期,能够还款的概率还是比较高。

消费金融行业绝大多数不良是因为欺诈引起的,如果反欺诈能够比较有效的情况下,信用风险控制在5%以内没有太大问题。

消费金融发放的借款都就小额分散的,没有任何抵押和担保的情况。随着消费金融行业的崛起和规模扩大,整个行业面临的欺诈问题越来越严重,一批批的羊毛党和欺诈等黑产团体接踵而来。黑产团队的规模越大,意味着消费金融机构的损失越大。

欺诈风险目前是整体消费金融风控的重点,目前整个行业75%甚至以上的风险都是来自欺诈风险。形式有很多种,如常见的身份伪冒、中介黑产、伪造材料、恶意套现等。欺诈主体一是申请本人或亲戚朋友,二是借用或盗用别人的身份信息进行欺诈。欺诈主体的不同,防范风险的手段和形式也不同。

架构实践

• 自动决策

风控流程自动处理案件,访问第三方合作伙伴的接口,获取用户黑名单、欺诈数据和多头借贷等数据,查询名单数据,决策引擎输出各环节处理结果。自动决策后出三个结果,自动通过、转人工、拒绝。

• 人工信审

根据决策引擎输出的结果进行转人工处理,人工通过初审和复核岗,给出具体信审结果,信审通过的案件给出风险等级和具体额度。

• 拒绝

被自动或者人工拒绝的案件通知到用户,建议补充资料、过段时间重新申请或者推荐到第三方机构

分布式、微服务架构

分布式架构目前是互联网行业成熟应用的架构,这里不详细讨论。

微服务架构下,比较成熟的使用Spring Framework,使用MyBatis、Hibernate等数据映射框架。

RPC架构

RPC是分布式架构的核心,解决服务分布和服务解耦问题,目前我们使用的是Dubbo, RPC框架解决序列化、反序列化、网络框架、连接池、收发线程、超时处理、状态机等“业务之外”的重复技术劳动。

分布式消息

分布式系统中重要的组件,解决应用耦合,异步消息,流量削锋等问题,是分布式系统不可缺少的中间件。目前在生产环境,使用较多的消息队列有ActiveMQ,RabbitMQ,ZeroMQ,Kafka,MetaMQ,RocketMQ等。

分布式缓存

高并发环境下,大量的读写请求涌向数据库,磁盘的处理速度与内存显然不在一个量级,从减轻数据库的压力和提高系统响应速度两个角度来考虑,一般都会在数据库之前加一层缓存。由于单台机器的内存资源以及承载能力有限,并且,如果大量使用本地缓存,也会使相同的数据被不同的节点存储多份,对内存资源造成较大的浪费,因此,才催生出了分布式缓存。常用的分布式缓存是Redis。

 分布式日志

分布式情况下,每个日志分散到各自服务所在机器,日志的收集和分析需要统一处理。日志框架主要这几块内容:

• 业务日志埋点

• 日志收集处理系统

• 日志处理系统

• 日志分析系统

ELK(ElasticSearch, Logstash, Kibana)平台可以实现日志收集、日志搜索和日志分析的功能。

原文链接:https://mp.weixin.qq.com/s/qrKShX7Uth79zuAGVyk5dQ

原文地址:https://www.cnblogs.com/liushiqiang123/p/11054919.html

时间: 2024-08-05 19:27:44

消费金融大数据风控架构的相关文章

互联网金融做大数据风控的九种维度

在互联网金融迅猛发展的背景下,风险控制问题已然成为行业焦点,基于大数据的风控模型正在成为互联网金融领域的热门战场.那么,大数据风控到底是怎么一回事呢?与传统风控相比,它又是怎样来进行风险识别的呢?本文对此进行了探讨. 大数据能够进行数据变现的商业模式目前就是两个,一个是精准营销,典型的场景是商品推荐和精准广告投放,另外一个是大数据风控,典型的场景是互联网金融的大数据风控. 金融的本质是风险管理,风控是所有金融业务的核心.典型的金融借贷业务例如抵押贷款.消费贷款.P2P.供应链金融.以及票据融资都

Data.gov.uk电子政务云,牛津大学NIE金融大数据实验室王宁:数据治理的现状和实践

牛津大学NIE金融大数据实验室王宁:数据治理的现状和实践 我是牛津互联网研究院的研究员,是英国开放互联网的一个主要的研究机构和相关政策制订的一个机构.今天主要给大家介绍一下英国数据治理的一些现状和实践.Data.gov.uk就是相当于英国的电子政务云.我不知道大家还记不记得这个画面,这是2012年伦敦奥运会的时候,当时的一幕,一个房子拉开了之后一个人在里面座着打计算机,这个人是一个英国籍也是牛津大学毕业的科学家,也是万维网之父.他当时创造互联网时候当时是一个博士生,他有一个想法就是说能不能有一个

金融大数据调研

大数据特点:海量.快速.价值.数据多样化,同样适用于金融大数据. 大数据金融特征与趋势 http://wiki.mbalib.com/wiki/大数据金融 大数据在银行业应用驱动分析 http://www.iteye.com/topic/1142295 大数据在银行业的案例分析 http://www.linguo.cn/news/html/402.html http://www.gbase.cn/products_detail/&productId=97.html Hadoop 平台在金融银行业

浅谈金融大数据

金融大数据的行业影响金融大数据在金融行业的应用能有效的帮助金融行业实现信息化转型,使得金融行业整体更为高效. 金融大数据的行业影响 金融大数据在金融行业的应用能有效的帮助金融行业实现信息化转型,使得金融行业整体更为高效. 金融大数据的帮助下,金融信息将会以更多的方式呈现.借助大数据可视化技术,结构化和非结构化数据可以从大量的金融信息之中提取出最有用的数据,并且用最合适的方式呈现,让用户可以从更多的角度和价值模型之中获益,帮助用于金融研究以及决策.金融大数据可视化还可以提供经济分析.管理分析以及绩

大数据风控质量好不好?从这几点来看

大数据风控从出世以来一直是资本关注的重点,市面上不仅有很多互联网金融公司开发了大数据风控模型,还有很多专门做大数据风控技术然后向业界输出技术能力的公司.然而,白热化的市场竞争中必然伴随着良莠不齐泥沙俱下的产品.虽然极高的技术壁垒,可靠安全的数据来源,形成了天然屏障把浑水摸鱼的产品隔离开来,但是对于那些不甚懂技术的人来说,一眼甄别大数据风控产品的成色是好还是坏还需要花不少时间. 风险控制作为金融的核心,一直备受关注.在传统金融机构中,会通过一些基础的金融逻辑来推断风险.比如收入水平越高偿还能力越高

知名大厂如何搭建大数据平台&架构

今天我们来看一下淘宝.美团和滴滴的大数据平台,一方面进一步学习大厂大数据平台的架构,另一方面也学习大厂的工程师如何画架构图.通过大厂的这些架构图,你就会发现,不但这些知名大厂的大数据平台设计方案大同小异,架构图的画法也有套路可以寻觅. 淘宝大数据平台 淘宝可能是中国互联网业界较早搭建了自己大数据平台的公司,下图是淘宝早期的 Hadoop 大数据平台,比较典型. 淘宝的大数据平台基本也是分成三个部分,上面是数据源与数据同步:中间是云梯 1,也就是淘宝的 Hadoop 大数据集群:下面是大数据的应用

大数据平台架构设计探究

本文首发于 vivo互联网技术 微信公众号? 链接:https://mp.weixin.qq.com/s/npRRRDqNUHNjbybliFxOxA 作者:刘延江 近年来,随着IT技术与大数据.机器学习.算法方向的不断发展,越来越多的企业都意识到了数据存在的价值,将数据作为自身宝贵的资产进行管理,利用大数据和机器学习能力去挖掘.识别.利用数据资产.如果缺乏有效的数据整体架构设计或者部分能力缺失,会导致业务层难以直接利用大数据大数据,大数据和业务产生了巨大的鸿沟,这道鸿沟的出现导致企业在使用大数

维信小贷发布“蜂鸟”大数据风控云平台

11月23日,上海首届中国普惠金融创新发展论坛上,维信小贷公司发布了自主研发.专门针对普惠金融及小额信贷领域的“蜂鸟”大数据金融云平台,维信理财集团首席技术官金家芳做了详细介绍和解读.    自2005年联合国与世界银行提出并推行“普惠金融”以来,虽然近几年我国小额贷款.P2P机构在普惠金融领域获得快速发展,然而普遍存在缺乏数据积累.风控技术及风控能力不足的挑战.当前,各类普惠金融服务机构绝大多数仍然采用传统的线下人工审核机制,面对小额.分散.快速的业务特征,难以获取和整合分析客户多维度信息,实

深入浅出解析大数据平台架构

目录: 什么是大数据 Hadoop介绍-HDFS.MR.Hbase 大数据平台应用举例-腾讯 公司的大数据平台架构 "就像望远镜让我们能够感受宇宙,显微镜让我们能够观测微生物一样,大数据正在改变我们的生活以及理解世界的方式--". 大数据的4V特征-来源 公司的"大数据" 随着公司业务的增长,大量和流程.规则相关的非结构化数据也爆发式增长.比如: 1.业务系统现在平均每天存储20万张图片,磁盘空间每天消耗100G: 2.平均每天产生签约视频文件6000个,每个平均2