云联反欺诈技术一瞥

众所周知,互联网普遍存在的“非人类流量”(NHT, non-human-traffic)干扰广告投放的现象,而公开交易市场又是一个通过实时竞价(RTB)售卖的最低层媒体库存的交易市场,它遍布中小媒体的海量库存,因此实施监控相当困难。造成该问题的原因,一个是许多用户计算机依然运行着老版本的Windows系统,这些系统感染了恶意软件,只要打开计算机,机器人就会在后台运行;另一个是Android手机,在用户毫不知情的情况下,预装或者安装了各种各样应用的情况比比皆是,被各种流氓软件留些后门已是常态,顺理成章地为黑色产业链做贡献。

云联传媒采用以下技术手段对作弊进行甄别。

1、通过云联自有IP库以及第三方合作对来路进行区分,目前可以识别以下五种数据来源:1)数据中心(即IP地址属于互联网数据中心机房)。2)专用出口(即IP地址是中大型机构使用的固定IP互联网接入专线)。3)骨干节点(即IP地址属于运营商路由器节点IP)。4)普通宽带(即IP地址是普通家庭或中小型机构、企业宽带等情况)。5)移动宽带(即IP地址是移动2G/3G/4G等情况)。前三种节点绝大部分都是不真实的流量,RTB参与竞价时会过滤掉。

2、运用机器学习算法和数据挖掘技术产生的IP真实度评分系统,能够识别出人类正常形态的数据。评分体系如下:0~49分:此区段的IP,与人类正常形态差异较大,RTB竞价时会下调或放弃出价;50~99分:此区段的IP,基本符合人类正常访问形态,可视为正常访问来源。

3、对广告投放按唯一用户设置频次控制,降低模拟器或程序自动刷流量的风险。

4、运用数据挖掘技术建立云联自己的反作弊库,从海量日志识别具有欺诈行为的APP、IP,在竞价时做过滤。主要从以下几方面认定:

1)广告点击率异常:指的是虚拟或恶意点击,即Click/PV过高比例,或者起伏很大。

2)访问者指纹信息(浏览器,操作系统等)异常:例如同等条件下占较大比例的访问都来自于同一版本的操作系统或浏览器;或者信息中带有Robot/Spider等标识信息。

3)IP分布异常:通过日志挖掘出某几个IP产生大量的点击或者曝光。

4)广告点击没有对应的曝光请求异常:如果广告同时监测了曝光和点击,广告的点击前都应该出现对应广告的曝光,且绝大多数都应该出现在同时段的曝光日志中。

5)广告访问时间分布异常/规律:某些IP/MZID每分钟定时出现在点击/曝光日志中,或者连续点击/曝光的发生时间的间隔过于规律。

6)广告来源异常:点击或者曝光的Referer可以标记点击或曝光的来源页面,如果大量来源集中在某一页面,且不是广告所在的Web页面,可能存在媒体在其他流量大的地方(如BBS)设置隐藏页面来充当曝光和点击。

时间: 2024-11-06 07:22:30

云联反欺诈技术一瞥的相关文章

大数据反欺诈技术架构

一年多以前,有朋友让我聊一下你们的大数据反欺诈架构是怎么实现的,以及我们途中踩了哪些坑,怎么做到从30min延迟优化到1s内完成实时反欺诈.当时呢第一是觉得不合适,第二也是觉得场景比较局限没什么分享的必要性. 时间也过了很久了,最近看到圈里一些东西,发现当时的这套架构并未落伍,依然具有很大的参考价值,所以今天跟大伙聊聊关于大数据反欺诈体系怎么搭建,主要来源是来自于我工作的时候的实践,以及跟行业里的很多大佬交流的实践,算是集小成的一个比较好的实践. 这套架构我做的时候主要领域是信贷行业的大数据反欺

决策引擎在支付行业的反欺诈应用

批准还是拒绝 收到交易请求 - 以在线支付方式购买价格为1500元的手机.批准还是拒绝? 某全球大型在线支付公司每天都处理上千万笔类似的请求.金融支付与科技创新深度融合,支付产品及场景更加丰富,支付更加简单.安全.方便.为了使服务体验不断优化.支付安全更有保障,在线支付平台与支付网络欺诈始终在进行着无休止的博弈.据<2016年国内银行卡盗刷大数据报告>不完全统计,运营商×××数量超过1.3亿张,网络诈骗"黑色产业"市场规模高达1100亿元,已成为中国第三大"黑色产

Maxent猛犸反欺诈入选Gartner 2018 Cool Vendors

"Maxent猛犸反欺诈SaaS服务结合被动式设备指纹和行为分析,有效提高欺诈检出能力. --Gartner" 2018年5月14日,全球知名的 IT 咨询及调研公司Gartner发布了2018年度数字颠覆与创新酷公司榜单(Cool Vendors in Digital Disruption and Innovation),Maxent猛犸反欺诈位列其中,并成为目前唯一一家人工智能反欺诈公司. 1 Maxent猛犸反欺诈的核心技术能力 Maxent猛犸反欺诈以多年积累的高性能流计算与无

从互金安全到互联网反欺诈,互金何时能解忧

随着互联网金融的快速发展,互金已经迅速渗透到人们的日常生活中,包括p2p理财.第三方支付等平台,都为我们的生活带来了便利.然而,互联网金融平台上汇集着众多用户的个人身份.银行卡账号等数据,一旦遭遇黑客的恶意攻击,系统内的数据安全就没有了保障,甚至还会出现泄漏个人身份.交易信息等状况,严重影响到了用户的财产安全. 根据中投融的数据显示,2015年被抽样检测的国内100个金融网站中,存在高危漏洞的网站占比达到53%.前段时间支付宝也出现安全漏洞,导致部分用户账号内的财产被盗刷,损失严重,也使得人心惶

云联首创立体化全方位多角度的定向体系

云联首创立体化全方位多角度的定向体系 助力广告主洞悉广告投放效果 精准定位是当前营销者使用的主要营销手段之一,对于提升广告效果而言也是显而易见的.以上海地区目标受众女性25岁至44岁.3+到达率为30%媒介目标为例,根据云联传媒跨屏智能广告投放平台AdCross计算结果显示,采用地域定向可以有效提升点击率3%以上:在地域定向的基础上进一步增加城区定向,可以有效提升点击率6%以上:而同时增加城区定向和商圈定向可以有效提升点击率10%以上. 日前,中国首家基于用户的全场景数字营销平台公司AdCros

人工智能反欺诈三部曲之:设备指纹

上次我们着重介绍了反欺诈的一项核心技术:特征工程. 在反欺诈的技术金字塔中,特征工程起着承上启下的作用.而居于特征工程的下一层的是基座层:数据.在机器学习里,大家有一个共识,高质量.相关的数据决定模型预测能力的上限,模型只是去逼近这个上限.数据就像原油,好的特征就像汽油,而模型就是引擎,三者缺一不可.作为基座层的数据层的一个重要组成部分是设备终端和网络风险,Gartner的经典五层模型同样将其列为最基础的数据.今天我们就来探讨一下处于这一层的设备指纹以及由此衍生出来的设备风险识别. ? 背景 ?

数据分析-信用卡反欺诈模型

本文通过利用信用卡的历史交易数据进行机器学习,构建信用卡反欺诈预测模型,对客户信用卡盗刷进行预测 一.项目背景 对信用卡盗刷事情进行预测对于挽救客户.银行损失意义十分重大,此项目数据集来源于Kaggle,数据集包含由欧洲持卡人于2013年9月使用信用卡进行交的数据.此数据集显示两天内发生的交易,其中284,807笔交易中有492笔被盗刷.数据集非常不平衡,积极的类(被盗刷)占所有交易的0.172%.因判定信用卡持卡人信用卡是否会被盗刷为二分类问题,解决分类问题我们可以有逻辑回归.SVM.随机森林

飞驰云联签约中国最大的数字地图提供商——四维图新

近日,Ftrans飞驰云联签约中国最大的数字地图提供商——四维图新(002405),为其提供高性能高可靠的跨国文件交换系统. 四维图新是导航地图.导航软件以及车联网解决方案领域的领导者,其客户和合作伙伴覆盖全球主要的乘用车.商用车厂商和系统商,在车载导航地图领域,更是多年占据国内市场的主导地位. 在自动驾驶.智能网的新时代,四维图新致力于以自动驾驶地图.高精度定位.以及应用于ADAS和自动驾驶的车规级芯片等核心业务,打造“智能汽车大脑”,成为中国乃至全球更值得信赖的自动驾驶解决方案提供商. 20

社交网络与反欺诈

设备指纹 一般都是基于某些设备信息,通过一些设备指纹算法会将这些信息组合起来,通过特定的hash算法得到一个最后的ID值,作为该设备的唯一标识符.常见的元素有: sim卡信息 wifi信息 硬盘信息 内存信息 屏幕信息 设备的传感器特征,比如麦克风.加速传感器.摄像头等信息 浏览器本身的特征,包括UA,版本,操作系统信息等 浏览器中插件的配置,主要是插件的类型与版本号等 设备操作系统的特征,比如是否越狱等 浏览器的Canvas特征,影响该特征的因素有GPU特性造成的渲染差异,屏幕的分辨率以及系统