大数据环境下,我们被卖了一次又一次

大数据,人工智能是当下互联网最热门的话题。
抛开大数据的人工智能都是耍流氓,人工智能需要大数据作为基础支持。

大数据是1980年,著名未来学家阿尔文·托夫勒便在《第三次浪潮》一书中,将大数据热情地赞颂为“第三次浪潮的华彩乐章”。大约从2009年开始,“大数据”成为互联网信息技术行业的流行词汇。
什么是大数据?
大数据,或称巨量数据、海量数据;是由数量巨大、结构复杂、类型众多数据构成的数据集合,是基于云计算的数据处理与应用模式,通过数据的集成共享,交叉复用形成的智力资源和知识服务能力。说俗一点就是很多很多的数据。
大数据从何而来?
物联网、云计算、移动互联网、车联网、手机、平板电脑、PC以及各种各样的传感器,无一不是数据来源或者承载的方式。而这些传感器采集的数据都是个人的行为数据。
当前社会环境下的诚信机制是围绕实名制建立的,也就是×××就是唯一代表一个人。
我们去电信运营商、银行、购买车票、网购 等一些列活动产生的记录就是大数据的一部分。
网络上说我们是在大数据环境下裸奔,这点从互联网环境来说也不算夸张,你带着手机出门的时候电信运营商的系统会记录你行走的轨迹,你打电话的时候运营商会记录你的通话记录从而分析你的关系网和社会地位等一系列属性进行打标签;你银行每一笔流水,账户来往银行都会记录,分析你的财务状况等等;你每次网购网购平台通过你搜索的关键字和你购买的东西以及你的评论都是大数据的来源,通过技术手段能分析出来你的年龄 性别 爱好 家庭情况 社会角色等等。
而我们产生的这些信息也就是大数据的来源,通过各个平台的挖掘,被卖了一次又一次,当你办理了信用卡的时候,就会一堆贷款公司给你打电话,当你去车站看了一次车,就会一堆4s店给你打电话告诉你最近有优惠要不要买车,一系列根据你的行为挖掘出的习惯和需求都卖给了商家甚至是诈骗团伙。目前我们国家交易这些隐私数据是犯法的,但是我们被卖了一次又一次,又有几个人被抓了,目前屈指可数。所以现在钻空子的企业和人还是很多,我们就这样被卖了一次又一次。

原文地址:http://blog.51cto.com/13466287/2329556

时间: 2024-08-01 07:26:33

大数据环境下,我们被卖了一次又一次的相关文章

XFS:大数据环境下Linux文件系统的未来?

XFS:大数据环境下Linux文件系统的未来? XFS开发者Dave Chinner近日声称,他认为更多的用户应当考虑XFS.XFS经常被认为是适合拥有海量数据的用户的文件系统,在空间分配方面的可扩展性要比ext4快“几个数量级”. “元数据验证”意味着,让元数据自我描述,保护文件系统,防范被存储层指错方向的写入.那么,为什么我们仍需要ext4? AD:WOT2015 互联网运维与开发者大会 热销抢票 [51CTO 2月7日外电头条]Linux有好多种件系统,但往往最受关注的是其中两种:ext4

大数据环境下的隐形隐私问题探讨

在大数据环境下,信息敏感属性由原来具体的.明确的属性集,成为散落在海量数据中分散的.模糊的信息碎片. 隐形隐私数据的安全保护核心就是基于数据防泄漏技术能够应对更广泛的隐私信息泄露渠道 ,以及采取与隐私隐私数据保护相对应的隐私保护技术手段和管理手段. 下载高清完整PPT材料以及获取更多精彩请扫描长图右下角二维码,加入IT狂想者,提升自我价值,共赢财富与未来! 原文地址:https://blog.51cto.com/cnsecurity/2386952

大数据环境下的数据仓库建设(转)

这几天研究了一家美国的大数据公司1010data,它在产品白皮书中提出了新一代数据仓库的概念(NEXT-GENERATION DATA DISCOVERY),相对于第一代数据仓库,具有如下一些特征: l  用户可以针对任何问题进行分析和查询,也就是说,分析系统要提供更加友好的操作体验,更加明细的数据粒度: l  分析效率和水平扩展,在大数据量的情况下,也要保证分析过程的高效率: l  数据混搭和数据分享,强调企业内部数据和外部数据的综合分析,以及数据的货币化: 在它的报告中,同时也非常强调自助分

大数据环境下的数据库架构

随着数据的快速增长,分表,分库,memcache,redis,mongodb,hadoop,bigtable等,各种解决方案呼之欲出.经过测试,在MySQL中,无论如何加索引,数据超过百w时,查询起来耗时很明显. 因此mysql分表分库+memcache+redis也不失是一个完美解决方案. 由于redis不支持复杂查询,redis的读取性能还是赶不上mem这些劣势,因此才需要一些搭挡. 流程 从CRUD看底层架构. 1. 插入数据 一般情况下,对用户是没有必要分表的,用户的文章或者微博才分表,

大数据环境下的数据仓库建设

作者:萝卜(微信:Robbie_Qi) 这几天研究了一家美国的大数据公司1010data,它在产品白皮书中提出了新一代数据仓库的概念(NEXT-GENERATION DATA DISCOVERY),相对于第一代数据仓库,具有如下一些特征: l  用户可以针对任何问题进行分析和查询,也就是说,分析系统要提供更加友好的操作体验,更加明细的数据粒度: l  分析效率和水平扩展,在大数据量的情况下,也要保证分析过程的高效率: l  数据混搭和数据分享,强调企业内部数据和外部数据的综合分析,以及数据的货币

大数据环境下的文件系统感想

而对于一些场景,比如虚拟机活动镜像的存储,或者说虚拟机硬盘文件的存储,还有大数据处理等场景,对象存储就显得捉襟见肘了.而文件系统在这些领域有突出的表现,比如Nutanix的NDFS(Nutanix Distributed Filesystem)和VMware的VMFS(VMware Filesystem)在虚拟机镜像存储方面表现很出色,Google文件系统GFS及其开源实现HDFS被广泛用于支撑基于MapReduce模型的大数据处理支持得很好,而且能够很好地支持百GB级.TB级甚至更大文件的存储

现阶段大数据环境中会存在什么样的不安全因素?

之前分享过的大数据时代的到来,为我们提供了哪些便利之处?今天墨者安全为大家分享下,在现阶段的大数据环境中,会存在什么样的不安全因素?如今各行各业的领域针对安全都有不同的需求,从采集.整合.提炼.挖掘到发布,这一流程已经形成一套完整的产业链条.随着数据的进一步发展,对于产业链中的安全防护变得更加困难,随时都会有数据泄露的风险,所以在大数据的应用过程中,如何确保用户及自身信息资源不被泄露,这将在很长一段时间都是企业重点考虑的问题.1.大数据的基础设施不安全因素包括存储设备.运算设备.一体机和其他基础

windows下用Eclipse连接大数据环境得hbase

1.解压hbase安装包 2.将大数据环境得hadoop安装包拷贝到windows(这里以d:/hadoop为例) 3.打开C:\Windows\System32\drivers\etc目录下的hosts并添加如下代码 127.0.0.1 localhost192.168.48.134 master192.168.48.133 slaver 注:这里你配置了几台服务器就写几台,这里我只配置192.168.48.134 master和192.168.48.133 slaver两台 4.使用Ecli

在Centos7下搭建大数据环境,即Zookeeper+Hadoop+HBase

1. 所需软件下载链接(建议直接复制链接到迅雷下载更快): ①hadoop-2.7.6.tar.gz: wget http://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/hadoop-2.7.6/hadoop-2.7.6.tar.gz ②zookeeper-3.4.12.tar.gz: wget https://mirrors.tuna.tsinghua.edu.cn/apache/zookeeper/stable/zookeeper-3