Esri 中国 卢萌
通常,推动大数据发展的起兴都是临时性的,一些企业和机构在运营的过程中被迫存储和通过检索收集到的大量的数据(无论他们想要与否),所以,大数据的获取,一般是通过一下几种不同的机制来实现:
1、一个企业在其正常的经营活动总已经收集到了大量的数据,并且真在寻求根据需要来对数据进行组织,以提供对各种信息更方便的进行检索。大数据的其中一个主要的作用,就是为了精简企业对数据日常使用的步骤。在这种情况下,数据是被动的等待着被使用。企业无法从这些数据中发现或者得到任何新的东西。它们只是想利用这些数据做点什么,虽然它们一直都在做,但是总想做得更好。
医疗中心是一个“意外”获得大数据资源的一个典型的例子。在日复一日的工作中,护理病人的信息和记录各种医疗数据的医院信息系统,导致了收集的数据以TB级别的形式的增长,如化验报告,药房订单,临床事故和计费数据等。但是大多数数据只在一次性的具体事务中被使用。(例如,支持临床诊断,代收代缴费用等)。
这些数据的收集在起先主要作用于行政人员在整体上把握运营策略,以实现既定的目标:如提高服务质量,提高工作人员的工作效率,降低运维成本等。
2、企业已经在其日常的活动过程中收集到了大量的数据,并且决定,需要用这些数据来支持新的业务活动。
考虑到现代企业,已经不在限制自己只制造一个产品,或者为一个目标受众服务。他们在不断的寻找新的机会。所以,通过市场或者web的项目,收集到的数据可能使企业了解的它们的忠实客户的喜好,并基于此开发符合这些期望的新产品,进而开拓新的市场。这样的企业将进一步成为混合型的大数据/制造型企业。
3、企业开始计划一个基于大数据资源的业务模式。不同于以往的企业,这个企业开始将大数据作为主要的业务支撑,并且以物理组建为次要支撑。亚马逊和联邦快递就属于这一类,虽然仓储、库存和运输以及快递等传统服务,一直都存在,但是传统业务缺乏创新性和高效性。所以他们开始就通过大数据的方式来提供相应的数据服务(如亚马逊的web目录和联邦快递的包裹追踪系统)。
4、企业作为大量的数据资源的拥有者,并且让所有人都明白,联合他们的数据资源,成为大数据的一部分,是他们共同的优势。其中一个例子就是共享有电子医疗档案的联邦医院数据库。
5、一些企业用他们的技能和远见来开发大数据应用,其中的特征就是收集和组织大量的数据来为自己和客户提供具有利益的项目。如谷歌和它所提供的服务就其中一个例子(见词汇表项目,网页排名、对象排名等)。
6、最后有一些组织自己没有数据,也没有相应的技术,但是它有足够的资金和远见。这样的企业会去协调一些数据的制造者和数据的持有者,并且建立一个可以被其他人来使用的大数据资源集合体。政府机构一直都是这种组织的资助者。当然,这样的大数据项目,如果无法用较低的成本来获取重大的发现的话,采用小一些的数据资源,是更合理的。
文章翻译自 Jules Berman 博士的著作《PRINCIPLES OF BIG DATA》