大数据带来广袤无垠的想象空间,但也只是想象而已

??

近日,有幸到贵阳学习了一圈大数据,多谢贵阳北斗空间崔师弟的支持和安排。显然,贵阳是一座超级牛逼的城市,将自已定位为高大上的“数据之都”,已建成大数据展示中心和大数据交易所,贵州七朵云【电子政务云、工业云、智慧旅游云、智能交通云、食品安全云、电子商务云、环保云】已开始在天上飘,今年还轰轰烈烈地举行了国际大数据产业博览会,简直比北上广热闹多了。

小弟在此无意也无理评价贵阳的大数据建设得如何,毕竟只是听到许多的讲解和看到许多的DEMO,但是否真的用之于服政利企惠民?实际上没有去深究。参观那几个点,其实就好象参观游览一个著名的4A景区一样,有很多领导的关怀,有很多牛逼的荣誉,有很多炫目的演示,个人认为已做得相当不错了,至少有那个概念和一定的效果,值得点赞!

我国掌握大数据的主人主要是政府机构,一个政府有二十几个委办局,各个委办局负责着某几个领域,包括政府自已的管理与监控、产业要素和发展、老百姓的吃唱拉撒衣食住行等,因此大数据主要由政府大数据、产业大数据和民生大数据组成。

现实中,政府部门掌握着中国大部分的核心数据,包括企业信用、个人信息、交通、医疗、国土、科技、社保、教育、工商、税务、通信、文化、旅游等等,尽管有些数据可能夸大了些,但那是合理的,这么巨量、类型繁多的数据目前来看是基本上是处于沉睡状态的,一是未能互联互通,二是数据很原始,企业或市民想要获取想要的数据,那个过程是相当复杂的,各地政府都在想方设法开放出来,但并不是一件容易的事,涉及的事情太多太多,如果没有搞清楚,开放后将带来一系列灾难性的后果。

首先是大数据的法律法规要从国家政策的层面制定好,就如同现在热闹非凡的互联网+,其实最迫切最应该加的是法律和法规,而不是各种摇旗呐喊和论坛会议,凡事先说后不乱。

其次是大数据的交易原则,哪些数据可以交易、哪些数据不能交易需要理清楚,交易的各方利益如何平衡?交易后的使用范围如何约定?但要搞清这些事,就需要懂得相关业务,必须具体问题具体分析,因为这涉及到国家安全、企业商业秘密和个人隐私,这是非常敏感的,比如我的很多个人数据,凭什么拿来随便交易,得到我的允许了吗?

基于以上的分析,因此你现在看到的很多大数据应用,大都是一种笼统的分析效果,但对于企业或个人而言,这样的效果并没有多大价值,其实我们想要的是一个组织或个人的核心分析数据,我买一个二手房,我就是想看这个房的历史交易数据,包括住过哪些人,他们的基本情况是如何的?等等诸如此类的数据,你和我吹牛逼说这个房的区域多好、环境多好、物管多好,那些银行、学校、商业中心等都是你们家的一样,其实在未来没有多大意义,因为人们越来越聪明了,消费越来越理性化。

这些年,随着互联网、移动互联网的快速发展,我们看到惊喜的一面,那就是在产业和民生方面的大数据慢慢地被一些行业大佬所拥有,比如电商行业的用户和交易数据基本上被阿里巴巴、京东等平台巨头所持有,海量的社交非结构化数据基本上被腾讯等巨头所持有,但这些数据是相互独立的,互不开放的,这是一个严重的问题,就如同目前的智慧家电家居,格力、美的、海尔等各搞各的,不理会什么标准和统一,搞下去谁来收拾这些烂摊子,让他们互相吵架打架?但苦的可是老百姓,因此政府理应在起步时就出来订规则和标准,你们这些小屁孩就得必须这么玩,否则回家洗了睡了,比如现在如日冲天的电商,也是没有订好标准和规则,这样搞下去那不得了,实体店和商业中心都关门了,十几亿的中国人难道都在电脑前手机上采购娱乐?那我们的情怀、文化和精神都统统不要了吗?

这几年,无论是政府还是专家学者,可能都把大数据的能力无限地夸大了,实际上大数据真不是万能的,万能的大数据是不真实的,我们的很多数据实际上质量是不高的,甚至是伪造的,另外我们的科学研究本身就不牛逼,一年到头国家花那么多的钱去搞科研,感觉不给力,也没看到有什么牛逼的大数据算法出来,辛苦的专家学者们好象都在学习和模仿,没有强大的科研和技术作为基础支撑,如何挖掘出有价值的数据和信息?吹那么多牛逼,其实毫无意义。

时间: 2024-10-14 11:25:41

大数据带来广袤无垠的想象空间,但也只是想象而已的相关文章

大数据带来的四大风险

最近关于大数据的新闻比比皆是,且这种报道从未停歇,直到现在.依托现有的大量的可以使用的数据,我们如今能够做的比我们十年前想象的还要多,但是对于大数据,我们还要面对另外一个问题--企业现在正面临着很大的风险. 难以想象我们正在谈论着的是如此庞大的数据量.正如一篇文章所说,"仅在2011年,1.8兆兆字节(1.8亿字节)的数据将被创建,相当于每一位美国公民在26976年里每分钟写三篇推特文章." 截止到2020年,这一数字预期将翻50倍. 这是多么庞大的数据量.大数据在提供众多优点的同时,

大数据的发展带来了不容忽视的挑战

大数据研究领域可谓炙手可热,然而对数据中的价值加以利用仍然充满挑战.今天,我们将对此类挑战进行详尽解析. 大数据的生成速度令人错愕,事实上90%的可用数据是在过去两年当中才刚刚出现.如今我们需要努力分析大数据,从而发现其中可用以指导决策及战略性业务转型的洞察结论. 大数据应用已经开始在改进产品.提升服务水平及客户服务等领域发挥作用.下面来看一组具体数字:只有17%的企业尚无任何计划建立大数据项目,而超过70%的企业已经开始使用大数据——包括将其整合至业务当中,或者作为试水性项目.数据技术正在逐步

大数据时代给社会科学研究带来新问题

大数据时代的图书出版是近两年的热点,8月27日即将在北京开幕的第21届北京图博会之前,不少出版界人士已纷纷开始筹备热议.那么,大数据时代,对学 术出版乃至社会科学研究有什么样的影响及意义呢?中国传媒大学调查统计研究所所长沈浩近日在第十五届全国皮书年会上,就相关话题做了专题报告. 沈浩认为,大数据时代,数据科学让人们越来越多地从数据观察到人类社会的复杂行为模式,以数据为基础,并非是数据改变了我们,起决定作用的是我们可用知识的增加. “大数据真的来了,我们要拥抱大数据,大数据对我们生活产生重大影响.

大数据和「数据挖掘」是何关系?---来自知乎

知乎用户,互联网 244 人赞同 在我读数据挖掘方向研究生的时候:如果要描述数据量非常大,我们用Massive Data(海量数据)如果要描述数据非常多样,我们用Heterogeneous Data(异构数据)如果要描述数据既多样,又量大,我们用Massive Heterogeneous Data(海量异构数据)--如果要申请基金忽悠一笔钱,我们用Big Data(大数据) 编辑于 2014-02-2817 条评论感谢 收藏没有帮助举报作者保留权利 刘知远,NLPer 4 人赞同 我觉得 大数据

社交关系与大数据的结合

大家还没搞清楚PC的时候,移动互联网来了,还没搞清楚移动互联网的时候,大数据来了. "有个不太靠谱的命题:如何让赵本山和迈克尔乔丹搭上关系?其实很简单,通过分析两个人的社交圈子,兴趣爱好等,最终可以找出一条线路能让他们两个人认识,这就是隐藏其中的大数据魅力之一点点-- 随着互联网的冲击,UGC(用户产生内容)不断发展,社交网络已经不断普及并深入人心,用户可以随时随地在网络上分享内容,由此产生了海量的用户数据.这些数据并不是我们想象中的那样冷冰冰.枯燥的数据,而是更加活生生.有趣的数据:这些数据不

华为内部关于大数据的一篇好文

科技的进步在很多的时候总会超出我们的想象,如果未来我们一个人拥有的电脑设备超过现在全球现在计算能力的总和,一个人产生的数据量超过现在全球数据 量的总和,甚至你的宠物小狗产生的信息量都超过现在全球数据量的总和,世界会发生什么呢?阅读本文,大数据(Big Data)会告诉你一个充满奇幻色彩的世界. 一.详解时髦词汇:大数据 似乎一夜之间,大数据(Big Data)变成一个IT行业中最时髦的词汇. 首先,大数据不是什么完完全全的新生事物,Google的搜索服务就是一个典型的大数据运用,根据客户的需求,

[网络报道] 机构选股逻辑基因变异 量化投资互联网掘金大数据

21世纪资管 宁夏 深圳报道 利用互联网金融大数据构建选股模型,正成为A股市场的一股新潮流. 10月20日,广发基金与百度公司合作开发的广发中证百度百发策略100指数基金将启动发行,这是业内首只跟踪具有互联网基因指数的指数型基金产品. 计划推出互联网基因 相关公司股票走势 招商证券32.95+1.163.65% 长江证券16.52+0.493.06% 指数产品的还有南方基金管理有限公司. “跟踪大数据指数的基金产品方案将于近期正式申报监管机构,预计年内发行跟踪i100指数的基金产品.”南方基金产

《大数据时代》读书笔记

大数据开启了一次重大的时代转型.就像望远镜让我们能够感受宇宙,显微镜让我们能够 观测微生物一样,大数据正在改变我们的生活以及理解世界的方式,成为新发明和新服务的源 泉,而更多的改变正蓄势待发-- 大数据的精髓在于我们分析信息时的三个转变,这些转变将改变我们理解和组建社会的方法. 第一个转变就是,在大数据时代,我们可以分析更多的数据,有时候甚至可以处理和第一个转变就是,在大数据时代,我们可以分析更多的数据,有时候甚至可以处理和 某个特别现象相关的所有数据,而不再依赖于随机采样. 某个特别现象相关的

核算大数据真实成本

可喜的是,大数据的“4V”理念volume.variety.velocity(容量.类型和速度).value(在前三者基础上实现收集.存储.管理.分析而产生的数据价值)已经获得市场认可,正在赢得更多的商业价值.但问题也随之而生.如此广泛的定义意味着不同的需求,不同参与者带来的不同界定.比如,volume方面,不同的组织定义显然不同.有些人认为,在相关BI环境中或其他系统中,超过10TB需要决策的数据就可以称为大数据,而另一些人认为至少要到PB.velocity也是如此.数以亿元的记录流入到企业内