现阶段大数据环境中会存在什么样的不安全因素?


之前分享过的大数据时代的到来,为我们提供了哪些便利之处?今天墨者安全为大家分享下,在现阶段的大数据环境中,会存在什么样的不安全因素?
如今各行各业的领域针对安全都有不同的需求,从采集、整合、提炼、挖掘到发布,这一流程已经形成一套完整的产业链条。随着数据的进一步发展,对于产业链中的安全防护变得更加困难,随时都会有数据泄露的风险,所以在大数据的应用过程中,如何确保用户及自身信息资源不被泄露,这将在很长一段时间都是企业重点考虑的问题。
1、大数据的基础设施不安全因素包括存储设备、运算设备、一体机和其他基础软件(如虚拟化软件)等。为了实施大数据的应用,需要建立大数据环境的基础设施。例如,需要高速的网络来收集各种数据源,大规模的存储设备对海量数据进行存储,还需要各种服务器和计算设备对数据进行分析与应用,并且这些基础设施带有虚拟化和分布式性质等特点。这些基础设施给用户带来各种新应用的同时,也会遭受到安全威胁。这种情况主要表现在假冒、身份***、非法用户进入网络系统进行违法操作,以及合法用户以未授权方式进行操作等;在数据传输过程中,利用电磁泄漏或搭线窃听方式截获机密信息,或通过对信息流向、流量、通信频度和长度等参数作为分析,窃取有用信息等;通过探查,恶意***来窃取或篡改数据;有的***还会利用网络传播计算机病毒,利用系统自身的漏洞,***主机或者进行***。
在传统的数据安全中,数据存储是非法***的最后环节,目前已形成完善的安全防护体系。大数据对存储的需求主要体现在大量数据处理、大规模集群管理、低延迟读写速度和较低的建设及运营成本方面。大数据环境下的数据非常的复杂,其数据量也是非常的惊人,保证这些信息数据在有效利用之前的安全是一个重要话题。在数据应用的生命周期中,数据存储是一个关键环节,数据停留在此阶段的时间最长。

2、互联网及移动互联网的快速发展不断地改变人们的工作、生活方式,同时也带来严重的安全威胁。网络面临的风险可分为广度风险和深度风险。广度风险是指安全问题随网络节点数量的增加呈指数级上升。深度风险是指传统***依然存在且手段多样;APT(高级持续性威胁)***逐渐增多且造成的损失不断增大;***者的工具和手段呈现平台化、集成化和自动化的特点,具有更强的隐蔽性、更长的***与潜伏时间、更加明确和特定的***目标。结合广度风险与深度风险,大规模网络主要面临的问题包括:安全数据规模巨大;安全事件难以发现;安全的整体状况无法描述;安全态势难以感知等。大数据时代的信息包装,导致来自网络的非法***次数急剧增长,网络防御形势十分严峻。因此对于大型网络,在网络安全层面,除了访问控制、***检测、身份识别等基础防御手段,还需要管理人员能够及时感知网络中的异常事件与整体安全态势,从成千上万的安全事件和日志中找到最有价值、最需要处理和解决的安全问题,从而保障网络的安全状态。

3、大数据通常包含了大量的用户身份信息、属性信息、行为信息,在大数据应用的各阶段内,如果不能保护好大数据,极易造成用户隐私泄露。此外,大数据的多源性,使得来自各个渠道的数据可以用来进行交叉检验。过去,一些拥有数据的企业经常提供经过简单匿名化的数据作为公开的测试集,在大数据环境下,多源交叉验证有可能发现匿名信息数据后面的真实用户数据,同样会导致隐私泄露。这个是大数据环境下急需解决的问题。隐私保护技术的不完善,因此要鼓励隐私保护技术的研发和完善,提倡行业在用户隐私保护领域自律,并制定相应的行业标准或公约来保障用户得隐私安全。
4、网络化社会使大数据易成为***目标,如论坛、博客、微博、社交网络,视频网站为代表的新媒体形式促成网络化社会的形成,在网络化社会中,信息的价值要超过基础设施的价值,极容易吸引***的***。另一方面,网络化社会中大数据蕴涵着人与人之间的关系与联系,使得***成功***一次就能获得更多数据,无形中降低了***的进攻成本,增加了***收益。近年来在互联网上发生用户账号的信息失窃等连锁反应可以看出,大数据更容易吸引***,而且一旦遭受***,造成损失十分惊人。大数据技术被滥用或者误用也会带来安全风险,因为大数据本身的安全防护存在漏洞,数据泄露同时***利用大数据技术收集更多的用户敏感信息。从社交媒体获取个人信息的准确性,基本的个人资料例如年龄、婚姻状况、教育或者就业情况等通常都是未经验证的,分析结果可信度不高以及数据信息是从公众渠道收集到的,可能与需求相关度较小。这些数据的价值密度较低,对其进行分析和使用可能产生无效的结果,从而导致错误的决策。

理解了大数据的核心价值以及应用广泛度,想要发展就必须跟上时代的脚步,明白了这一点之后,对待数据安全要有更严格的标准。昨天墨者安全和一个企业运营的好友聊天,说到了很多企业现在还没有防御安全的意识,一般都是被***了才会想起来防御,这种想法完全是错误的,有一句话是安全意识,从小做起。这里不仅包括生活中的安全,环境安全还有信息安全和网络安全,这都是重中之重。

原文地址:https://blog.51cto.com/14277241/2381410

时间: 2024-11-05 16:54:41

现阶段大数据环境中会存在什么样的不安全因素?的相关文章

Kafka在大数据环境中的应用

我们生活在一个数据爆炸的时代,数据的巨量增长给我们的业务处理带来了压力,同时巨量的数据也给我们带来了十分可观的财富.随着大数据将各个行业用户.运营商.服务商的数据整合进大数据环境,或用户取用大数据环境中海量的数据,业务平台间的消息处理将变得尤为复杂.如何高效地采集.使用数据,如何减轻各业务系统的压力,也变得越来越突出.在早期的系统实现时,业务比较简单.即便是数据量.业务量比较大,大数据环境也能做出处理.但是随着接入的系统增多,数据量.业务量增大,大数据环境.业务系统都可出现一定的瓶颈.下面我们看

XFS:大数据环境下Linux文件系统的未来?

XFS:大数据环境下Linux文件系统的未来? XFS开发者Dave Chinner近日声称,他认为更多的用户应当考虑XFS.XFS经常被认为是适合拥有海量数据的用户的文件系统,在空间分配方面的可扩展性要比ext4快“几个数量级”. “元数据验证”意味着,让元数据自我描述,保护文件系统,防范被存储层指错方向的写入.那么,为什么我们仍需要ext4? AD:WOT2015 互联网运维与开发者大会 热销抢票 [51CTO 2月7日外电头条]Linux有好多种件系统,但往往最受关注的是其中两种:ext4

windows下用Eclipse连接大数据环境得hbase

1.解压hbase安装包 2.将大数据环境得hadoop安装包拷贝到windows(这里以d:/hadoop为例) 3.打开C:\Windows\System32\drivers\etc目录下的hosts并添加如下代码 127.0.0.1 localhost192.168.48.134 master192.168.48.133 slaver 注:这里你配置了几台服务器就写几台,这里我只配置192.168.48.134 master和192.168.48.133 slaver两台 4.使用Ecli

大数据环境下,我们被卖了一次又一次

大数据,人工智能是当下互联网最热门的话题. 抛开大数据的人工智能都是耍流氓,人工智能需要大数据作为基础支持. 大数据是1980年,著名未来学家阿尔文·托夫勒便在<第三次浪潮>一书中,将大数据热情地赞颂为"第三次浪潮的华彩乐章".大约从2009年开始,"大数据"成为互联网信息技术行业的流行词汇. 什么是大数据? 大数据,或称巨量数据.海量数据;是由数量巨大.结构复杂.类型众多数据构成的数据集合,是基于云计算的数据处理与应用模式,通过数据的集成共享,交叉复用

大数据环境下的隐形隐私问题探讨

在大数据环境下,信息敏感属性由原来具体的.明确的属性集,成为散落在海量数据中分散的.模糊的信息碎片. 隐形隐私数据的安全保护核心就是基于数据防泄漏技术能够应对更广泛的隐私信息泄露渠道 ,以及采取与隐私隐私数据保护相对应的隐私保护技术手段和管理手段. 下载高清完整PPT材料以及获取更多精彩请扫描长图右下角二维码,加入IT狂想者,提升自我价值,共赢财富与未来! 原文地址:https://blog.51cto.com/cnsecurity/2386952

k8s与docker与大数据环境的构建工作

大数据环境与docker 在使用CDH构建在k8s上的时候遇到了异常困难的问题,其检查机制会将解析主机的IP作为目标容器的IP,导致两者无法正常安装部署,只能放弃已经做好的容器镜像,之后在不断的寻找中终于到了可以达到预期目标的方法. 首先是找到了Spark的两个容器镜像: https://hub.docker.com/r/bde2020/spark-master https://hub.docker.com/r/gettyimages/spark 其中big-data-europe/docker

在Centos7下搭建大数据环境,即Zookeeper+Hadoop+HBase

1. 所需软件下载链接(建议直接复制链接到迅雷下载更快): ①hadoop-2.7.6.tar.gz: wget http://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/hadoop-2.7.6/hadoop-2.7.6.tar.gz ②zookeeper-3.4.12.tar.gz: wget https://mirrors.tuna.tsinghua.edu.cn/apache/zookeeper/stable/zookeeper-3

大并发大数量中的MYSQL瓶颈与NOSQL介绍

NoSQL在2010年风生水起,大大小小的Web站点在追求高性能高可靠性方面,不由自主都选择了NoSQL技术作为优先考虑的方面.今年伊始,InfoQ中文站有幸邀请到凤凰网的孙立先生,为大家分享他之于NoSQL方面的经验和体会. 非 常荣幸能受邀在InfoQ开辟这样一个关于NoSQL的专栏,InfoQ是我非常尊重的一家技术媒体,同时我也希望借助InfoQ,在国内推动NoSQL 的发展,希望跟我一样有兴趣的朋友加入进来.这次的NoSQL专栏系列将先整体介绍NoSQL,然后介绍如何把NoSQL运用到自

java 11-8 在大串中查找小串的案例

1.统计大串中小串出现的次数 举例: 在字符串"woaijavawozhenaijavawozhendeaijavawozhendehenaijavaxinbuxinwoaijavagun" 结果: java出现了5次 分析: 1.首先已经知道字符串 A:定义一个统计变量=0: B:在大串中查找小串是否存在,用 int indexOf(String str):返回指定字符在此字符串中第一次出现处的索引. a:如果返回的索引值是-1,则说明 大串中并不存在这个小串,输出统计变量 b:返回