如何用机器学习定位账户冒用问题

对于一个互联网站点,这其实是一个挺平常的问题,因为目前“撞库”的发生。我们收集的数据主要还是来源于如下数据:

三层数据:IP地址

四层数据:TCP初始端口、TCP初始序列号(不同系统可能存在一些实现上的差异)、滑动窗口大小

七层数据:用户浏览器指纹数据,如UserAgent等能从一定角度体现用户浏览器特征的数据,比如Chrome、Firefox、Safari等就有所不同

应用系统日志:获取用户浏览页面分类信息、页面转换序列及相关时间等等。

将一段时间的上述历史数据(设定窗口,每一项可作为一个维度)通过一定的函数转换最终进行归一化处理(Normalization,归一化也可对不同维度进行加权),然后通过本次浏览情况判断是否是出自同一用户,如果不是则应发送响应通知原用户,可能出现冒用情况。

判断的方法可以使用简单的余弦夹角、马尔科夫或距离关系等。形式化的描述就暂不给出了。

时间: 2024-11-08 15:45:12

如何用机器学习定位账户冒用问题的相关文章

如何用机器学习强化市场营销活动。

以下是我自己翻译的, 错误难免,请见谅. 英文原文,地址https://econsultancy.com/blog/65275-how-to-use-machine-learning-to-enhance-your-marketing-campaigns/ 机器学习看上去和市场人员没啥关系, 这玩意貌似只是那些程序狗,计算机呆子做的事情, 但其实任何人都可以通过机器学习提升他们的数字广告营销活动的效果, 本文是一篇介绍性文章,可以帮助你对这个领域一探究竟. 机器学习是一个迷人的话题, 无论你是否

巧用机器学习定位云服务器故障

欢迎大家前往腾讯云+社区,获取更多腾讯海量技术实践干货哦~ 本文由roganhuang发表于云+社区专栏 导语 随着腾讯云业务的扩大,母机数量越来越多.为减少人力并实现母机故障的自动化定位,本文尝试利用机器学习算法,通过对历史故障母机的日志数据学习,训练模型实现自动化分析定位母机故障原因. 背景 对于每一单母机故障我们都需要定位出背后真实的故障原因,以便对相应的部件进行更换以及统计各种部件故障率的情况,因此故障定位和分析消耗的人力也越来越多.希望能借助机器学习的方法对历史故障母机的日志数据进行学

如何用机器学习对文本分类

需求 使用监督学习对历史数据训练生成模型,用于预测文本的类别. 样本清洗 主要将重复的数据删除掉,将错误无效的数据纠正或删除,并检查数据的一致性等.比如我认为长度小于少于13的数据是无效的遂将之删掉. def writeFile(text): file_object = open('result.txt','w') file_object.write(text) file_object.close() def clear(): text = "" file_obj = open(&qu

线上服务 CPU 100%?一键定位 so easy!

转自:  https://my.oschina.net/leejun2005/blog/1524687 摘要: 本文主要针对 Java 服务而言 0.背景 经常做后端服务开发的同学,或多或少都遇到过 CPU 负载特别高的问题.尤其是在周末或大半夜,突然群里有人反馈线上机器负载特别高,不熟悉定位流程和思路的同学可能登上服务器一通手忙脚乱,定位过程百转千回. 对此,也有不少同学曾经整理过相关流程或方法论,类似把大象放进冰箱要几步,传统的方案一般是4步: top oder by with P:1040

定位页面元素之xpath详解以及定位不到测试元素的常见问题

一.定位元素的方法 id:首选的识别属性,W3C标准推荐为页面每一个元素设置一个独一无二的ID属性, 如果没有且很难找到唯一属性,解决方法:(1)找开发把id或者name加上.如果不行,解决思路可以是: 1. 找到该按钮的特征,例如按钮的文字是 submit: 2. 用XPath定位,可以这样写://button[@value='submit'].(注意是单引号!!) name:和id一致 ClassName:对某些具有相同类的元素一网打尽的好方法 link text 和 partial lin

实例详解机器学习如何解决问题 转

原文:http://tech.meituan.com/mt-mlinaction-how-to-ml.html 前言 随着大数据时代的到来,机器学习成为解决问题的一种重要且关键的工具.不管是工业界还是学术界,机器学习都是一个炙手可热的方向,但是学术界和工业界对机器学习的研究各有侧重,学术界侧重于对机器学习理论的研究,工业界侧重于如何用机器学习来解决实际问题.我们结合美团在机器学习上的实践,进行一个实战(InAction)系列的介绍(带“机器学习InAction系列”标签的文章),介绍机器学习在解

(七)机器学习里的特征工程

不管是工业界还是学术界,机器学习都是一个炙手可热的方向,但是学术界和工业界对机器学习的研究各有侧重,学术界侧重于对机器学习理论的研究,工业界侧重于如何用机器学习来解决实际问题.我们结合美团在机器学习上的实践,进行一个实战系列的介绍,介绍机器学习在解决工业界问题的实战中所需的基本技术.经验和技巧.本文主要结合实际问题,概要地介绍机器学习解决实际问题的整个流程,包括对问题建模.准备训练数据.抽取特征.训练模型和优化模型等关键环节:另外几篇则会对这些关键环节进行更深入地介绍. 下文分为: 1)机器学习

机器学习和深度学习资料合集

机器学习和深度学习资料合集 注:机器学习资料篇目一共500条,篇目二开始更新 希望转载的朋友,你可以不用联系我.但是一定要保留原文链接,因为这个项目还在继续也在不定期更新.希望看到文章的朋友能够学到更多.此外:某些资料在中国访问需要梯子. <Brief History of Machine Learning> 介绍:这是一篇介绍机器学习历史的文章,介绍很全面,从感知机.神经网络.决策树.SVM.Adaboost到随机森林.Deep Learning. <Deep Learning in

[转]机器学习和深度学习资料汇总【01】

本文转自:http://blog.csdn.net/sinat_34707539/article/details/52105681 <Brief History of Machine Learning> 介绍:这是一篇介绍机器学习历史的文章,介绍很全面,从感知机.神经网络.决策树.SVM.Adaboost到随机森林.Deep Learning. <Deep Learning in Neural Networks: An Overview> 介绍:这是瑞士人工智能实验室Jurgen