反作弊基本概念与机器学习的应用(1)

反作弊主要业务流程:

常见作弊方式:

机器作弊:机器刷量、任务分发、流量劫持

人为作弊:QQ群/水军、直接人工、诱导

常见作弊手段:

电商:刷单,刷信誉,刷好评,职业差评师

支付平台:洗钱,诈骗

广告:数据造假、刷流量 (引流—广告展示—广告点击—转化)

自媒体、社交软件:刷粉丝、刷点击、阅读量

搜索:seo使用作弊手段刷排名(案例:2015蜻蜓FM “普罗米修斯”、“宙斯”函数,修改转化量、流量在前端展现欺骗投资人,被对手反编译识破)

广告作弊涉及的点击类型分类:

1、  按照是否找商品找服务为目的

2、  是否按照是否恶意,有无真实转化为依据

(CPC基于点击计费的模式、CPA基于成交的点击进行收费)

点击四大分类:

无效点击(没有形成转化的意愿,仅仅浏览)

恶意点击(必须识别出来)

转化点击(真实意愿点击)

误点(不是以找商品为目的,例如内部人员点击,需要识别出来)

人群划分:

误点:员工、广告主自己、竞品销售中介、爬虫

恶意点击:同行、同行朋友、联盟站点、机器

反作弊策略应对框架:

数据层:鼠标轨迹行为、指纹数据、案例库、行为数据

特征层:离散指标、连续指标

行为识别层:点击识别模型、异常监测模型、流量识别模型、关系图模型、人群识别模型

策略应对层:规则

三层监控指标体系,提前预警:

运营指标监控:投诉率、转化率、撞线速率/频率、消耗速率、通过率

规则监控指标:拦截率、准确率、覆盖率

异常监控指标:IP维度、Cookie维度、计费名维度、广告维度、设备维度、鼠标轨迹维度

分类监控、分级响应:

1、  针对监控情况、采用四级响应机制;

2、  红色:非常严重,需要自动化采取短期策略应对,例如临时黑名单机制

3、  橙色:较为严重,短信举报,要求4h内完成分析和短平快策略压制,后续进一步处理

机器学习在反作弊应用几个案例:

如关联规则、决策树模型:策略挖掘—规则自动提取

确定建模问题:自动发现规则、辅助策略设计;

应用:挖出的规则,上线到离线反作弊系统

评估指标:支持度、置信度、覆盖率、拦截率

流量聚类分级模型,kmeans算法:异常行为识别—流量识别

作用:支持流量分级打折策略

例如分为以下类别,特征描述:

1、  主要为品牌浏览器入口,转化效果较好,用户粘性较高;

2、  电话转化很好,包括搜索行为、点击行为、转化行为都较好;

3、  电话转化良好,没有明显的特征异常;

4、  电话转化率略偏低,详情页其它点击行为略偏少;

5、  详情页停留时间短,转化效果特别差;

6、  电话转化很好,无其它任何转化行为,专门点击商业广告,行为非常异常;

7、  点击率高,无转化,行为非常异常.

如半监督或图算法:异常行为识别—基于关系发现:

作弊用户标签比较少,如何召回更多的数量?

借助半监督或图算法发现更多的异常用户·

SVM算法:异常行为识别—销售识别

作用:识别用户是否销售

数据来源:行为日志,聊天记录

惩罚系数C,选择RBF函数作为kernel的参数gamma的选择.

粗粒度搜索:

  对大数据集,先选择一个较小的子集做粗粒度搜索;

  选择较大的步长,找到一个最优的(c,g)局部区域.

细粒度搜索:

在局部区域,以较小的步长,找到全局最优的(c,g)

如图论与余弦距离:搜索引擎防作弊

图论:作弊的网站一般需要相互链接,以提高自己的排名,这样在互联网大图中形成一些Clique.图论中有专门发现Clique的方法.

余弦距离:那些卖链接的网站,都有大量的出链(这些出链的特点和不作弊的网站出链特点大不相同).每一个网站到其他网站的出链数目可以作为一个向量,计算余弦距离.发现,有些网站的出链向量之间的余弦距离几乎为1.一般来讲这些网站通常是一个人建的,目的只有一个:卖链接.

时间: 2024-12-19 18:44:37

反作弊基本概念与机器学习的应用(1)的相关文章

搜索引擎反作弊之:整体技术思路

目前搜索引擎作弊手段五花八门,层出不穷,作为应对方的搜索引擎,也相应调整技术思路,不断有针对性地提出反作弊的技术方案,所以如果整理反作弊技术方案,会发现技术方法很多,理清思路不易. 尽管如此,如果对大多数反作弊技术深入分析,会发现在整体技术思路上还是有规律可循.从基本的思路角度,可以将反作弊手段大致划分为以下三种:“信任传播模型”.“不信任传播模型”和“异常发现模型”.其中前两种技术模型可以进一步抽象归纳为“链接分析”一章提到的“子集传播模型”,为了简化说明,此处不再敷述,而是直接将这两个子模型

移动互联网广告 - 第六更 - 移动广告的作弊方法及反作弊 - 2016/12/07

CPC.CPA.CPS 广告的作弊方法 [致敬原作者:NiuGuoZhu - http://www.iamniu.com/2012/09/28/aidma-aisas-cicas/] 介绍媒体对CPC.CPA.CPS广告可能进行的作弊方法.分析作弊方法是为了我们更好的了解对手,为了更好的防作弊. CPC作弊 总的而言,CPC作弊容易,但也容易反查出来的.常用的点击软件进行点击作弊行为. CPA作弊 CPA计费会因为客户对A的定义不同而产生多种情况,比如A有可能是注册,有可能是安装软件,甚至可能是

CPC广告反作弊

原文:http://blog.csdn.net/xwm1000/article/details/45460957 CPC广告上线也2年了,从上线以来就一直存在着作弊和反作弊的斗争,刚开始的时候流量少,反作弊只有1.2条规则,我记得曾经有一段时间反作弊挂了将近一周都没有人知道,也从来没有用户有投诉.随着流量的慢慢增多,稀稀拉拉的有一些投诉,记得印象最深的是智能的一个手机用户,投诉了将近有半年,我们这边也组织了很多人去排查,没有发现什么问题,后来从全站的nginx日志来看,发现很多IP的入口都是XX

星际真高手,约战用FF反作弊对战平台

星际一 [FF]反作弊对战平台让作弊行为无所遁形目前能检查星际霸主以及其他星际争霸ZUOBI软件支持108 113 116 118 https://pan.baidu.com/s/1slv0329 注意FF 只为星际游戏提供辅助 所以是专业的

七成App推广造假,反作弊到底动了谁的蛋糕?

目前移动互联网市场高速发展,移动应用快速增长,随之而来的是黑灰色产业接踵而至,APP   推广刷量.O2O"羊毛党"刷单等作弊现象不断出现.有媒体公开报道,APP 推广七成数据被造假.针对这些问题,在移动互联网安全领域,从业经验超过 10 年的资深手机安全技术专家数盟科技 CTO  张宇平向我们介绍,反作弊技术上的难点是一方面,更难的是动了谁的蛋糕. 通过技术手段解决移动开发者的推广难题 几年前,张宇平和几个朋友发现移动互联网市场有种奇怪的现象:在移动应用的推广方面,一个有效的 App

被信通院白皮书提及的“网易云营销反作弊业务”到底什么来头?

信通院<云计算发展白皮书>封面 近日,信通院对外发布了2018年<云计算发展白皮书>,白皮书提及网易云易盾营销反作弊业务,并点评此业务是衡量云服务商实力的重要因素之一.信通院提及易盾营销反作弊服务 网易云易盾营销反作弊业务,能实时识别刷单.刷票.刷券等营销作弊行为,有效防范羊毛党,为企业营销活动提供安全保护,保障活动效果. 有效遏制羊毛党的背后,不被大家所知的是,易盾实际上为业务安全风险产品国标制定者之一.易盾参与了业务安全风险控制产品和服务技术要求和评估方法的确定,对业务安全产品

网易云易盾中标浙报反作弊服务 助力浙江新闻App健康发展

近日,国内领先的智能业务安全平台网易云易盾和浙报传媒旗下"浙江新闻"达成合作,易盾将为浙江新闻客户端提供大数据反作弊服务,助力浙江新闻抵御刷单.薅羊毛等灰黑产侵害,辅助新闻运营工作健康有序发展,保障广大真实客户的体验和利益. 浙江新闻是浙江日报报业集团推出的第一款移动新闻客户端,正飞速发展为浙江本地政经第一平台.在运营模式上立足本地化,不断探索可视化.互动化.个性化,打造了一系列大数据技术为基础的媒体融合平台,有力促进新闻内容生产.提升新闻内容传播效果.优化新闻客户端发展,也使得用户收

网易云易盾推出面向微信小程序的大数据反作弊产品

近日,国内领先的业务风控服务网易云易盾对外推出面向微信小程序的大数据反作弊产品,源于网易20年的核心业务风控技术与全面稳健的策略模型,有机整合了设备指纹.IP画像.规则引擎等八大能力,可广泛应用电商营销.金融支付.生活服务类小程序场景,帮助企业防范微信小程序端的黑灰产作弊侵害. 易盾安全调查显示,小程序已成为企业业务风险环节新缺口 易盾安全经过调查发现,相比App,大部分互联网开发者还没有足够的能力利用小程序的特性建立起有效的风控策略."羊毛党"通过自己养号或着批量购买的大量微信号,就

用户奖励体系有哪些反作弊的机制?

营销活动中,抽奖系统刷奖.刷票.刷券的人群,俗称羊毛党,常以低成本甚至零成本换取利润.对于羊毛党,大家是又爱又恨. 羊毛党通过大量的手机号和IP.接入打码平台,批量注册各类电商以及O2O帐号,使用批量操作软件刷取商家活动资源,已经实现赚钱自动化和产业化,(俗称"躺着赚钱").羊毛党可使用群控设备批量领取优惠券,人工下单或利用设备技术优势瞬时秒杀,但艰辛致富的道路上怎么能够容忍这般不公? 为防止这种情况的发生,我们需要从源头上对垃圾账号进行识别: · 黑名单库全面:历史黑名单库可以精确识