大数据运营之孕育小结局:凡事预则立,不预则废

【文摘自:李福东《大数据运营》第3章内容回顾?,了解更多请关注微信公号:李福东频道】

编者按

“孕育”意味着埋下一颗希望的种子,要想让这个“种子”满足预期要求,必须从全局和长远考虑,对于设计大数据服务这颗高科技“种子”,还应当具备正确的思维方式,具备面向服务、面向过程、全生命周期、数据即资产的观念,将大数据作为服务或者产品来对待,以价值创造为衡量大数据服务的原则,整合企业内部及社会数据,充分挖掘大数据的潜力。

文章正文

不同于面向操作的事务型应用,大数据服务更多地是一个探索发现的过程,对于已经发现规律并模型化的大数据服务,可以构建数据模型并嵌入到事务型应用的过程环节中,比如银行对于个人客户的授信服务,可以构建授信模型,通过收集个人客户相关数据计算客户风险敞口,实现客户贷款过程中的快速授信。

在很多情况下,大数据服务是一个探索发现的过程,即通过不断的尝试,发现数据之间的规律。因此对于大数据服务,应当采取快速迭代、螺旋上升的开发模式,通过不断调整和优化数据模型和算法,达到大数据掘金的目的。

大数据服务是先有“数”后有“求”,因此应当首先对大数据的潜在能力进行分析。比如当你具备移动用户上网记录大数据后,参考移动用户上网记录大数据的元数据,发现移动用户上网记录中包含用户数据(终端、号码、IP等)、应用数据(域名、IP等)以及网络数据(位置区、小区、网络类型、流量、时长、经纬度等),从而确定借助通信大数据,可以具备“再现”移动用户的上网行为的能力。

对于“求”,可以分析一下可能有哪些需求。还是以移动用户上网记录大数据为例,网络规划设计是对网络建设进行决策,那么我们的需求就是如何完成无线网络的规划设计,比如在哪里建设,在哪里需要扩容,建设或者扩容的规模有多大等。有了移动用户上网记录大数据,就可以基于用户价值和应用价值完成无线网络的规划设计。

大数据服务架构设计是通过制定大数据服务参考框架,厘清大数据服务在不同阶段、不同层次上的关注点以及这些关注点之间的关系。

大数据服务模型设计关注面向操作和面向主题的数据模型设计,通过数据模型的构建,解决大数据承载、数据分析以及数据展现问题。

如果说数据是大数据服务构建的基础,那么数据模型则是大数据服务实现的载体,数据模型的设计对于大数据服务至关重要。通过分析大数据服务从操作型数据模型到分析型数据模型的渐进过程,能够清晰地看到数据模型从操作环境到分析环境发展变化,加深对数据模型的认识。

大数据服务容量设计则是关注如何规划和监控大数据服务基础设施资源需求,以最佳成本效益的方式完成大数据基础设施能力的设计。

数据通常要经过采集、存储、整合、分析、展示、归档、销毁的过程。从大数据的价值角度看,那些活性高,频繁使用的数据,通常具有较长的生命周期,反之,那些很少被使用的数据,尽管由于法律法规要求需要保留较长的时间,但是其应当“离休”,迁移到“非活动”区域。

从成本角度看,应当综合大数据活性、价值、法律法规要求等对数据进行分级存储,实现成本效益的最大化。比如,经常使用的数据放在价格高但是访问速度快的缓存、内存、磁盘中,而对于那些偶尔访问的数据放在廉价的磁盘、光盘等存储介质中,对于访问频率极低甚至很长一段时间(比如3年)没有访问的数据,应转移到价格更低的磁带介质中。

通过对大数据活性、价值、法律法规的观察,将数据存储到不同的存储介质上,即提高了数据访问的效率,也降低了大数据存储成本。对于那些已经确定不用的或者按照存储要求到期的数据,通过审批机制进行数据销毁。

大数据服务过程设计的目的是保证大数据服务能够得到有效的管理。大数据服务过程设计主要包括大数据服务目录管理、容量管理、供应商管理以及安全管理四个方面。

目录管理过程保证大数据服务能够得到最大程度的共享和使用,消除企业内部大数据服务能力交叉和重叠的现象,企业在形成大数据服务之前,需要查看是否已经具备类似的大数据服务,尽量重用现有大数据服务。

容量管理过程保证大数据服务拥有足够的、最佳成本效益的基础设施资源,包括存储空间、计算能力以及网络传输带宽。企业可以基于大数据访问活跃度、法律法规要求等完成数据的迁移、归档、销毁等任务。

供应商管理过程用于保证数据源的质量和及时性。大数据时代,组织势必会引入多个供应商的数据,供应商提供数据的质量和及时性关乎到组织的数据分析能力,企业应当建立对供应商数据质量的评价方法和制度,保证数据的准确性。供应商提供数据的及时性对组织大数据服务生产效率影响很大,同样是需要保障的重要因素。

安全管理过程保证大数据的合规性,组织的大数据往往是个人和组织在生产生活中留下的“痕迹”,因此组织对隐私侵犯和商业秘密侵犯的分析和管理,成为大数据服务“开放”或者“封闭”的重要依据,组织可以通过匿名、审批、统计数据提供等方式规避隐私侵犯和商业秘密侵犯问题。

大数据服务组织设计在大数据服务的构建过程中起到非常重要的作用。由于大数据服务通常是在探索中发现的,因此要求大数据服务设计人员具有问题领域很强的专业背景甚至多行业知识背景。

按照专业化分工和关注点分离的原则,大数据服务设计阶段主要考虑两种角色:大数据服务业务分析师和大数据服务系统架构师。

大数据服务业务分析师主要关注专业领域分析模型的构建,这个角色要求具有很强的行业知识,能够根据组织决策需求进行建模,能够使用数据建模和数据分析软件和工具完成分析模型的构建、优化、展现工作。

大数据服务系统架构师关注大数据服务基础设施的架构,包括存储架构、计算架构以及网络架构,保证大数据服务具有可用的基础设施资源,负责监控数据的活动情况,根据大数据服务需求进行数据迁移或者增加大数据服务基础设施资源,满足大数据分析的性能需求和存储空间需求。

作者简介

李福东,资深大数据和信息化专家,培训师,《大数据运营》著作者,现为北京某高科技公司CEO,拥有20年电信、金融、互联网等跨行业工作经验,长期致力于企业架构、大数据、人工智能、区块链、虚拟现实、数字化转型等创新与实践。

了解更多最新干货,请加入本文作者知识星球(数智萤火虫),您将至少获得:

1、问题解答。72小时内答复数字科技相关问题。

2、精品文章。每周至少分享一篇原创精编长文。

3、精华PPT。最新培训、公开课PPT干货分享。

4、精美礼物。赠送小礼品、红包、作者签名书。

原文地址:https://blog.51cto.com/lifudong/2473187

时间: 2024-11-10 11:08:31

大数据运营之孕育小结局:凡事预则立,不预则废的相关文章

大数据运营之孕育:分析处理系统容量设计方法

[本文摘自:李福东<大数据运营>3.5.1.2,了解更多,请关注微信公号:李福东频道] 编者按 大数据服务通常要经过数据ETL.数据存储.数据分析.数据展示.数据开放的过程,因此在计算能力.存储能力以及网络能力的估算上也有自身的特点. 正文 与事务处理应用相比,大数据服务属于分析处理应用,由于两者的数据处理特点不同,因此容量估算方法也有一定的区别. 大数据服务通常要经过数据ETL.数据存储.数据分析.数据展示.数据开放的过程,因此在计算能力.存储能力以及网络能力的估算上也有自身的特点. 大数据

大数据运营之孕育:服务过程设计,卓有成效的管理者

[本文摘自:李福东<大数据运营>3.6?,了解更多请关注微信公号:李福东频道] 编制按 大数据服务过程包括:服务目录管理.容量管理.可用性管理.连续性管理.服务等级管理.信息安全管理.供应商管理等. 正文 在设计方法方面,大数据服务与支撑企业运营的服务既存在区别,又存在联系.不同之处是:大数据服务的设计主要以"数据"为参考点,"数据"类型越多.越丰富.越新鲜,则越有助于设计好的服务:两者的共同点是:大数据服务归根结底还是为企业运营服务的,是为了提升企业在

小数据大道理:新书《大数据运营》众筹启示

2015年7月,我的***作<大数据运营>在众筹网发起30天的图书预售活动,筹资金额5000元,从项目发起的两天半时间,即周五下午到周日晚上,就超额完成了预定目标,非常的震撼.最终,总共得到102名支持者的支持,除了两位无私支持者一位,恰好是100为获得实物回报的支持者,总筹资金额7999元,超额完成了预定目标. 通过众筹网的图书推广活动,也获取到支持者的订单数据,具体包括下单时间.配送地点.购书数量.购书金额.与笔者的社会关系等.由于只有102位支持者,所以订单数据量很小,所有就不能称之为&

大数据运营-服务型企业架构新思维

目前市面上关于大数据的图书主要分为两类:一类主要讲大数据对社会生活的影响,属于大数据科普书,读一读可以增强对大数据的感性认识:另一类则属于大数据专业技术书,主要讲大数据相关技术,可以帮助开发出大数据应用. 本书既不是泛泛的谈大数据的重要性,也不深入专业技术细节,而是从业务和企业发展战略出发,运用系统化和全生命周期管理思维,给出大数据从需求到落地的整体解决方案.犹如个人的修齐治平,在大数据时代,企业要想得以生存和发展,同样需要经历筑巢.联姻.孕育.分娩.培育以及腾飞的6个发展阶段. 在筑巢阶段,企

《大数据运营》读书分享会活动

本周四(7.5)20:00-21:00,我与大家在线分享<大数据运营>图书的精要内容,同时植入区块链与大数据融合创新.互联网与区块链思维等新的知识点,欢迎大家关注.交流. 新增知识点之一:[区块链与大数据融合创新思考]大数据是生产资料,是新能源,但是大数据行业最大的问题和困难是:组织之间的数据难以流通和共享,如果这一问题得不到解决,数据就难以释放能量并创造更大的价值.数据难以流通和共享的主要原因是数据的开放可能会触犯个人隐私或者引发安全问题,也就是说当前还没有一种很好的办法解决由数据开放引起的

大数据运营之数据治理

数据治理包括:隐私.安全.合规性3个方面. 大数据价值创造的前提和基础是企业自身的数据以及全社会开放的数据,当数据开放为社会带来好处的同时,也同时因此了隐私侵犯问题.隐私是社会赋予个人或者企业的权利,隐私权受到法律的保护,因此,企业在利用大数据的同时,要首先考虑大数据应用是否会侵犯他人或者组织的隐私. 企业可以多种方式来解决隐私触犯问题. 对于企业向内部人员提供的大数据服务,可以通过数据权限保证隐私数据不被非法获取,如果企业内部用户具有获取隐私数据的权限,要进行数据使用行为的记录和跟踪.例如,电

大数据运营之数据分析

数据分析过程包括:数据建模.大数据处理.告警与触发.报告等. 从数据处理的实时性要求角度看,大数据分析可以分为批量和流式两种数据处理方式.批量处理主要适合于实时性要求不高的分析型应用,而流式处理主要适用于实时性要求高的在线分析应用. 批量处理方式主要适用于大规模离线数据的分析处理,比如企业周期性统计报表,可以采样批量处理方式.对企业大规模历史生产经营数据进行批量处理,分析结果可以用于制定企业发展战略,对于分析结果的实时性要求不高. 流式处理方式有许多应用场景,比如客户浏览网页时,企业可以实施实时

大数据运营之渠道数据模型设计

渠道是企业将产品和服务交付给客户的一种手段.渠道可以整合各种产品和服务,在产品日益同质化的今天,渠道在社会中的重要性越来越突出. 渠道在产品和服务的提供方和消费方之间的作用如图3-4-5所示: 图3-4-5渠道是连接客户与产品/服务的桥梁和纽带 按产权归属,可以将渠道分为自有渠道和社会渠道:按照存在形态,可以将渠道分为实体渠道和电子渠道. 企业的渠道服务体系如图3-4-6所示: 图3-4-6企业渠道服务体系示例 电子渠道可以降低产品和服务交付成本,提供客户获取产品和服务的便捷性,在互联网发达的今

大数据运营之数据存储

大数据服务的数据源不但来自归属于不同行业的组织之中,而且其类型还具有多样性(Variety)特征. 多样性指的是大数据服务不仅包括例如姓名.年龄这样的结构化数据,还包括歌曲.电影这样的非结构化数据,此外网页.邮件这样的数据介于结构化和非结构化之间,属于半结构化数据,也是大数据服务的重要数据源. 结构化数据来源于业务需求,系统分析员将需求中静态的"名词"提取出来并进行抽象,作为数据库表结构设计的依据.比如我们设计一个学籍管理系统,通过分析发现"张三"."李四