宜信大数据实时授信平台技术、架构、模型解析(PPT)

宜信大数据实时授信平台包含姨搜、知识图谱、授信和反欺诈引擎等模块。平台结合了用户授权数据、第三方数据、互联网海量数据等不同数据源,最大限度地获取 用户信息。授信和反欺诈引擎结合了专家知识和机器学习算法,分析客户的信用状况和欺诈风险,实时估计授信额度、检测欺诈风险。

这个平台到底是做什么事情的?通过对各种各样不同的数据员的接入,包括自己的数据。通过对它的接入分析,梳理,挖掘,关联和理解。

做了一堆的事情,但是三样最重要的事情是说,

第一个分析客户的信用状况。

二我们会检查欺诈的风险,我们这个行业欺诈是非常非常重要核心的东西要去做。

第三个所有做完这些东西,我还是想做什么?我是想做希望实时能够估计信用额度。这不是我今天站在这个地方纸上谈兵的一个事情,我们上面已经有垂直的,已经在市场上在做。

大家都知道宜信有一个非常棒的一个互联网产品叫宜人贷,有不同的模式,其中有一个是极速模式,我们这个平台做的第一件事情,我们支持宜人贷。你要上去去投标。如果非常幸运,可能10分钟就能买标。我能不能做到通过数据让宜人贷一分钟之内可以授信呢我们当时做了这样一件事情,我请来申请贷款的这些人给我一些数据。

什么样的数据比如你信用卡的流失数据,比如你在淘宝,天猫京东的购买数据,或者你在运营商的通话记录,加上其他我们已经爬下来的,我们做了搜索引擎,大量的网上的数据,加上宜信自己的数据,还有我们很多生态伙伴第三方的数据。所有的数据加起来,我能够做出来,在实时一分钟其实是几毫秒之内,能够做到给你授信,你给我这些数据,我能说不能贷给你,还是能贷给你两三万,我眼看着向10亿在迈进,我们这是我们做的第一个产品。

当然我们也有很多的合作伙伴,不同的方式在做这件事情,后面的原理是类似的,同一个平台在驱动。我们在9月份跟易贝做了战略合作,中国有一大堆在华南华东的外贸电商,不在天猫,不在淘宝卖东西,在易贝卖到外国,到我的网站,这个网站上去,把它的易贝帐户提交给我,绑给我,把分钟之内,你这个帐号值多少钱,还是对不起,你这个帐号没有足够的数据,是不值钱的,请你以后再来。这个产品,是我们做的第一个尝试,拿商家的流水拿来做这个依据。加上我们其他的各种各样不同的数据源来的数据,所有的数据做一个理解,做到现在做了大概几千万的级别。

可能很多人会问我说,因为时间关系,没有办法我只能说做一个非常非常简单的展示,传统的金融机构,大家也做模型,做算法很多诸如此类的数据挖掘,传统的数据模型,比如说,他可能会放几十个变量,或者撑死了放几百个变量,我们的方法不一样,我的有几十万个或者更多的变量,传统的模型里头,非常强调说所有的这些特征,要是可以解释的。所以他需要非常非常强的特征。在我的这个模型里头,在我们这个平台的模型里头,对于我来讲,所有的数据,都是信用数据。当中交易数据,流水数据这些数据大家可以想象到,其他很多的数据,比如你的搜搜数据,网上的很多其他点击数据也是特征。如果这些特征被吸收的话,可能非常弱的特征没有关系,最后我能做出不管是信用,还是反欺诈,我后面有一堆模型在这边,我做的手段跟传统机构不一样的。

今天我其实是想说的是,今天在座很多人,你们做O2O,你们也会积累数据,大量的各种各样的数据。我站在这个地方是希望跟你说有另外一种新的变现手段,数据变现的手段,你提供金融服务,可以是C端的流量,也可以是B端的流量,我们作为第三方,我的这个平台可以跟你合作,提供一个金融变现这样一个能力。

关于宜信公司

以提供个人对个人的小额信用贷款中介服务为业务核心,广泛开展财富管理、信用风险评估与管理、信用数据整合服务、小额贷款行业投资。宜信公司目前已在全国150多个城市和40多个农村地区建立起强大的全国协同服务网络,为客户提供全方位、个性化的财富增值与信用增值服务。

关于演讲人:魏旋

2010年毕业于清华大学电子工程系,获得博士学位。毕业后加入美国著名视频网站Hulu工作,离开Hulu之前负责Hulu广告精准投放技术的研究与开发,带领团队从头搭建了Hulu精准广告全部的算法及系统。Hulu 2012年跟Nielsen/Facebook联手推出的Guaranteed Demo Targeting,引领全球Display Ad Targeting的创新潮流,不仅给Hulu创造了可观的经济效益,同时也开创了Video Ad Targeting的一个新篇章,多家竞争对手纷纷效仿。这是魏旋带领团队一手打造的创新成果。2013年加入宜信大数据创新中心担任首席数据科学家,目前负责宜信大数据实时授信平台,大数据驱动的反欺诈和风险预测平台的研究与开发。

End.

时间: 2025-01-02 15:54:37

宜信大数据实时授信平台技术、架构、模型解析(PPT)的相关文章

大数据时代征信业发展探析

近年来,随着互联网技术的发展,大数据越来越受到关注,其应用逐步渗透至多个行业,开启了全新的数据时代.数据是征信业务开展的基础资料,征信活动主要是围绕数据进行采集.整理.保存.加工,并最终向信息使用者提供.大数据不仅为征信业发展提供了极为丰富的数据信息资源,也改变了征信产品设计和生产理念,成为了未来征信业发展最重要的基石.我国征信业发展尚处于起步阶段,在大数据时代存在征信法律制度和业务规则不够完善.征信机构数据处理能力有待提高等问题.未来征信业面临的机遇和挑战并存,研究大数据时代征信业的发展具有重

大数据云计算openstack云平台基础到精通实践视频教程

38套大数据,云计算,架构,数据分析师,Hadoop,Spark,Storm,Kafka,人工智能,机器学习,深度学习,项目实战视频教程 视频课程包含: 38套大数据和人工智能精品高级课包含:大数据,云计算,架构,数据挖掘实战,实时推荐系统实战,电视收视率项目实战,实时流统计项目实战,离线电商分析项目实战,Spark大型项目实战用户分析,智能客户系统项目实战,Linux基础,Hadoop,Spark,Storm,Docker,Mapreduce,Kafka,Flume,OpenStack,Hiv

大数据-实时推荐系统最主流推荐系统itemCF和userCF视频教程(项目实战)

38套大数据,云计算,架构,数据分析师,Hadoop,Spark,Storm,Kafka,人工智能,机器学习,深度学习,项目实战视频教程 视频课程包含: 38套大数据和人工智能精品高级课包含:大数据,云计算,架构,数据挖掘实战,实时推荐系统实战,电视收视率项目实战,实时流统计项目实战,离线电商分析项目实战,Spark大型项目实战用户分析,智能客户系统项目实战,Linux基础,Hadoop,Spark,Storm,Docker,Mapreduce,Kafka,Flume,OpenStack,Hiv

大数据实时流统计视频教程(项目实战)

38套大数据,云计算,架构,数据分析师,Hadoop,Spark,Storm,Kafka,人工智能,机器学习,深度学习,项目实战视频教程 视频课程包含: 38套大数据和人工智能精品高级课包含:大数据,云计算,架构,数据挖掘实战,实时推荐系统实战,电视收视率项目实战,实时流统计项目实战,离线电商分析项目实战,Spark大型项目实战用户分析,智能客户系统项目实战,Linux基础,Hadoop,Spark,Storm,Docker,Mapreduce,Kafka,Flume,OpenStack,Hiv

赵强老师免费公开课第三季:大数据实时计算

大数据实时计算公开课课程简介 课程简介 实时处理系统,也称为流式处理系统,是目前大数据领域中非常热门的处理技术.相对于传统的离线数据处理系统,实时系统能够更加准确的得到处理的结果数据.目前实时处理系统有两大主流框架:一种是基于Apache Kafka和Apache Storm的框架:另一种是基于Spark Streaming的处理框架. 本次公开课将基于Apache Kafka和Apache Storm的框架,详细介绍这两部分的内容:第一部分将介绍大数据的消息系统:第二部分将介绍大数据的实时处理

【大数据】大数据-实时统计分析-方案选型

大数据-实时统计分析-方案选型 image2017-10-27_11-10-53.png (1067×738) elasticsearch-head Elasticsearch-sql client spark streaming reload_百度搜索 基于spark streaming的网管系统告警过滤算法的设计与实现 - 其它论文 - 道客巴巴 scala - Spark Streaming into HBase with filtering logic - Stack Overflow

能源管控系统开发,BI大数据可视化管理分析平台开发

能源管理系统是以帮助工业生产企业在扩大生产的同时,合理计划和利用能源,降低单位产品能源消耗,提高经济效益为目的信息化管理系统.通过能源计划,能源监控,能源统计,能源消费分析,重点能耗设备管理,能源计量设备管理等多种手段,是企业管理者对企业的能源成本比重发展趋势有准确的掌握,并将企业的能源消费计划任务分解到各个单位,是节能工作责任明确,促进企业健康稳定发展.针对我国工业生产线中的在线计量.功效检测技术和节能控制技术严重缺乏等问题.研究开发工业生产线关键点在线电能计量.加工功效有效性分析技术,工业生

大数据时代的新BI系统架构发展趋势

商业智能(BI,Business Intelligence),它是一套完整的解决方案,用来将企业中现有的数据进行有效的整合,快速准确的提供报表并提出决策依据,帮助企业做出明智的业务经营决策. 商业智能的概念最早在1996年提出.当时将商业智能定义为一类由数据仓库(或数据集市).查询报表.数据分析.数据挖掘.数据备份和恢复等部分组成的.以帮助企业决策为目的技术及其应用.目前,商业智能通常被理解为将企业中现有的数据转化为知识,帮助企业做出明智的业务经营决策的工具.商务智能系统中的数据来自企业其他业务

[转]携程大数据实践:高并发应用架构及推荐系统案例

本文来自携程技术中心基础业务研发部的<应用架构涅槃>系列分享.据基础业务研发部负责人李小林介绍,互联网二次革命的移动互联网时代,如何吸引用户.留住用户并深入挖掘用户价值,在激烈的竞争中脱颖而出,是各大电商的重要课题.通过各类大数据对用户进行研究,以数据驱动产品是解决这个课题的主要手段,携程的大数据团队也由此应运而生:经过几年的努力,大数据的相关技术为业务带来了惊人的提升与帮助.以基础大数据的用户意图服务为例,通过将广告和栏位的“千人一面”变为“千人千面”,在提升用户便捷性,可用性,降低费力度的