为什么你的安全数据湖项目会失败

真搞不懂,一些团队由于某些原因居然认为他们可以建立一个安全数据湖和/或他们自己的大数据安全分析工具。让我来告诉你们会发生什么——失败。

提示一下数据沼泽笑话。想想数据浮渣。讨论一下在数据池里撒尿。结果是一样的——不会成功。

好吧,让我缓和一点来说说——0.1%的人将会成功(即使这种成功只是一定程度上的)。(这个百分比是近似值,不是为了提供数据,意在增加这个“职位”戏剧性的影响。)

为什么我会对此如此坚持呢?在我们的UEBA研究期间,我们遇到了几个正在从DIY/定制安全分析迁移到COTS的组织(通常成熟的做法是迁移到UEBA)。令我们震惊的是,一些组织宣称他们确实曾经有一个运行了几年的定制安全分析项目,但目前已经由于“高投入——低价值”而终止了。更令人震惊的是,一些组织本属于“五十强”选手,大概是全球技术精英。但他们的项目甚至一点用都没有。QotD项目(后被修改为用来移除与客户端任何可能的关系)被认为“我们希望从未发现过Hadoop——我们因试图从中创造安全分析功能而浪费了数年。”

廉价硬件的使用,减少数据冗余(存储一份拷贝——NICE!)以及高级分析的承诺,人们受到这些鼓动并趋之若鹜……然而绝大部分情况都是——大写的“失败”。

失败或相对不那么成功的原因包括:

脏数据——你把东西放进去却不能使用;这是个头号的“失败原因”(一个相关的好故事,《怎样不雇佣你的第一个数据科学家》,https://hackernoon.com/how-not-to-hire-your-first-data-scientist-34f0f56f81ae

收集数据的麻烦——SIEM供应商由于某个原因花费了十多年来调试他们的收集器……

访问数据的麻烦——数据钻进劣质酒——而且现在已经没有人知道如何把它们弄出来进行分析了(这里有个好故事,《是时候停止使用Hadoop来进行分析了》It‘s Time to Stop Using Hadoop for Analytics

没有超越收集的价值——数据湖被创建然后被数据填满,然后它只是摆在那里以防万一(被人说没有?),然而后续的项目进程全都停止了

没有超越关键字搜索的价值——建立数据湖是为了实现高级分析,但最后仅仅提供了基础的日志关键字搜索

没有威胁检测价值——这发生在有人请一家大数据公司建立安全数据湖时,他们建造了所有的管道,并说“啊,安全用例?你自己做吧!”并转身离去

未能概念化以及定义安全分析用例——好了,我们现在将检测威胁了……好吧,如何进行?额,没人知道,也没时间去试验。再回头看看“一号”——脏数据

安全分析用例设计比预想的要难得多

更高的分析门槛和更高的对大数据专业技术人才的需求以及并未能获得那样的人才

(注意有些条目是重叠和/或相关的)

正如我们在这里所说,“考虑到数据湖技术特征的简单性,我们不应认为从这个概念中获得价值完全取决于高级编程的实现和分析技能的可用。”安全起见,你还需要加入威胁分析技能。

实质上,唯一成功的项目类型(然而从长期来看,这并不是真正的安全分析)是“安装ELK,接入日志,搜索关键字”。它工作的不错,但这并不是我们所追求的——差远了。甚至不在同一个领域。

总的来说,成功的定制大数据安全分析产品仍然寥寥无几,就像会飞的汽车。我在2012年的博文中充满希望——但遗憾的是并未奏效。对于这一点,我非常清楚,DIY或开源绝不是进行安全分析的方法。当然,我们会持续关注Spot和Metron,但坦率地说,在这一点上我深怀疑虑。

好,总结一下:开源——基于日志聚合,定制安全分析——只在极少的情形下能够工作的不错。如果你仍然想尝试,请随时查看本文来检验你的想法。

原文链接:Why Your Security Data Lake Project Will FAIL! - Anton Chuvakin

作者:Anton Chuvakin

时间: 2024-08-27 14:27:45

为什么你的安全数据湖项目会失败的相关文章

数据湖是一种方法 数据湖的四个最佳实践

转载自:http://bigdata.chinabyte.com/311/13871811.shtml 数据湖听起来很简单:把数据或信息汇集到一个结合处理速度和存储空间的大数据系统――Hadoop集群或内存解决方案,那样业务部门就能访问数据,获取新的洞察力.不过,与IT行业的许多技术一样,现实比梦想困难得多. Pentaho公司的创始人兼首席技术官詹姆斯·狄克逊(James Dixon)发明了这个术语,他表示,其中一方面是由于对数据湖应该是什么存在着误解.他从来就没有打算用数据湖来描述从所有企业

BI、数据仓库、数据湖和数据中台内涵与差异

http://km.ciozj.com/Detail.Aspx?AI=98314&CI=2 随着大数据技术的不断更新和迭代,数据管理工具得到了飞速的发展,相关概念如雨后春笋一般应运而生,如从最初决策支持系统(DSS)到商业智能(BI).数据仓库.数据湖.数据中台等,这些概念特别容易混淆,本文对这些名词术语及内涵进行系统的解析,便于读者对数据平台相关的概念有全面的认识. 一 数据仓库 数据仓库平台逐步从BI报表为主到分析为主.到预测为主.再到操作智能为目标. 商务智能(BI,Business In

数据工程师必须掌握的7个大数据实战项目

简介: 值得收藏,数据工程师必须掌握的7个大数据实战项目 原创: Lenis 有关SQL 1作为一名电影爱好者,我阅片无数,有些片子还经常翻来覆去看个好几遍.小时候因为这事儿,没少被我妈抓耳朵,“看过的片子为啥还要倒二遍?”我也说不上来,就是单纯的爱看. 男人爱看的电影,以武侠,动作,科技为多,也认识了一帮明星,比如尼古拉斯凯奇,史泰龙,李小龙,成龙,李连杰,甄子丹等等.这些人很猛,有男人气.只要是他们的片儿,肯定不落下.在我眼里,他们就是好片代名词. 不知几何时,电影上开始出现一些不认识的男明

数据湖(Data Lake)前世今生解析(上)

EMC收购视频存储设备厂商Isilon Systems完善EMC在分布式Scale-Out架构NAS技术方面的不足,近几年isilon在媒资.大数据和HPC场景得到客户的一致认可,也在去年和另外一个产品线Povital Hadoop推出了数据湖解决方案,应对互联网浪潮下客户对半结构化和非结构化数据的处理.存储需求. 在讲数据湖之前,我们一起在回顾下数据库和数据仓库.数据库指在线交易数据系统.一般指OLTP事务处理,数据库中的数据也是进行了分类的:数据仓库一般指通过ETL工具抽取分类中的离线数据,

O`Reilly FreeBook:数据湖构架 简介

O`Reilly 的 < Architecting Data Lakes Data Management Architectures for Advanced Business Use Cases >,全面介绍了数据湖的构架.工作机理.构建与管理.规划.价值.展望等诸多方面的内容. 其目录如下: 1. Overview What Is a Data Lake? Data Management and Governance in the Data Lake How to Deploy a Dat

QTP校验数据库中数据后台项目

数据校验功能后台主要包括两个类:QTPCommonServlet.java和QTPCommonDao.java 其中QTPCommonServlet.java为: package com.runqianapp.qtp; import java.io.PrintWriter; import javax.servlet.http.HttpServletRequest; import javax.servlet.http.HttpServletResponse; import com.runqiana

QTP校验数据库中数据前台项目

首先看一下效果图: 未操作之前页面: 进行操作之后的页面: 前台jsp: <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); request.setCharacterEncoding("UTF-8"); String basePath =

聚合数据 iOS 项目开发实战:条码查询器

记录下,聚合数据 iOS 项目开发实战:条码查询器:视频地址:http://www.jikexueyuan.com/course/324.html 条码查询API:https://www.juhe.cn/docs/api/id/52 核心内容: 1.条码查询器结构分析.2.如何将聚合数据 SDK 添加到工程中.3.模型以及业务类的封装.4.控制器间的数据传递.5.tableView 以及 webView 的使用. 具体课时 1.条码查询器界面搭建 12:53 本课时通过分析条码查询的UI结构和业

30天搞定大数据爬虫项目

详情请交流  QQ  709639943 00.30天搞定大数据爬虫项目 00.零基础实战机器学学习 00.企业级实战 Spark离线和实时电影推荐系统 00.三大项目掌握Storm流计算 00.道路交通实时流量监控预测系统 00.基于Spark2.x新闻网大数据实时分析可视化系统 00.小码哥Java大神班五期 任小龙SSM Spring5 Mybatis SpringMVC 00.Python玩转人工智能框架 TensorFlow 00.web开发级mysql颠覆实战课程 00.微信小游戏入