大数据绝对可以算得上当下的流行话题,购物要大数、出行要大数、看病要大数、上学要大数……,好像什么行业都能与大数据搭上边,又似乎一切都可以大数据了。对于经历过多年企业信息化的传统企业来说,大数据对于他们既清晰、又迷茫,他们有过数据仓库、数据挖掘、商业智能(BI)概念的洗礼,但又看不懂“大数据”与之前的概念有哪些不同。
按照百度百科的解释,大数据技术(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法通过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。大数据的4V特点:Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)。显然上述解释仅仅是描述了大数据的一些特征,对于企业如何开发大数据、利用大数据进行运营管理,并没有过过多的指导。
本文建议传统企业在建设大数据系统的过程中,不仅要建设数据分析平台,更要构建起一个数据分析的生态圈,让人人都是分析师,让数据分析渗透到企业运营的每个环节,真正实现数据运营、科学决策的管理模式。构建数据分析生态圈,可以概括为“两个市场,一个平台”,两个市场是指业务数据市场、分析工具市场,一个平台是分析观点分享平台。
一.业务数据市场,让业务数据变得开放透明。
业务数据是分析的源泉,没有数据就谈不上大数据。企业经过多年的信息化建设,一般都会有多套业务系统在运行,如办公自动化系统(OA)、财务管理系统、ERP系统等不一而足,但这些业务系统都是孤岛式隔离,数据缺乏整合,而且底层数据库都是经过专业设计、复杂度较高,非厂家技术人员难以使用,通常都是利用定制报表的方式进行分析和使用。因此,在利用数据上存在着数据提取难度高、报表需求响应慢、数据准确性差等问题。
产生上述问题的原因在于,传统数据结构复杂,对业务人员不开放,利用报表的方式提供数据时,需求人员期望的数据与技术人员提供的报表之间存在着巨大的鸿沟。建设业务数据市场就是将各业务系统的数据进行抽取、清洗、整合之后,按照业务过程重新进行整合,封装为统一粒度、统一维度的数据库表。这些数据表的特点就是能被业务人员所理解并解读分析,这样业务人员可以在较早期就发现数据中间存在着的问题。在建设数据市场的过程中,有几点需要特别注意:
l 采用维度建模方法,以“易懂性、易用性”为原则。业务数据市场的数据是供企业分析人员使用,他们更多的是不懂技术的业务人员,数据结构应该符合多数人的直觉,而非像传统“三范式”那样,需要借助复杂的ER图才能表述清楚。对于专业的IT人员,尤其是要抵制将维度模型设计成“雪花模型”以节省数据重复、增加灵活性的诱惑,从而带来模型复杂性的代价;
l 全面梳理业务,实现数据的互联互通。传统企业的业务系统,多数是烟囱式的软件系统,若不在企业层面进行业务梳理,就不能很好地对数据进行整合,提取有价值的信息。在整合数据的过程中,必须要有统一的维度才能有效实现数据整合,比如,统一的客户编码、身份证号等,所以梳理企业层面的统一维度是实现数据整合的关键步骤;
l 分主题、稳步推进。企业运营涉及的业务过程众多,眉毛胡子一把抓是不可能的。在建设企业数据市场时,要根据企业的特点,优先建设对运营最重要的业务,尽快投入使用,逐步完善,比如,一个销售类的企业可以先将订单业务整合起来;
二.分析工具市场,打造适合需要的分析框架。
数据是一座金矿,但还需要依赖好的工具才能将金子提炼出来。直接分析原始数据虽然灵活,但更加适用于高水平的人员,对于大多数的一线员工,应该提供更加易用的分析工具,如报表、图表、报告等,将业务指标以形象的方式展现出来。分析工具市场就是企业内部汇集分析工具的地方,提供给员工根据自身情况使用。
分析工具市场包含两部分功能,一是制作分析工具的开发平台,一是运行分析工具的门户平台。在建设分析工具市场的过程中,有几点需要注意:
l 分析工具市场建设。从技术角度来看,分析工具市场可以找到众多的软件系统满足需求,企业可以根据实际情况,或采购、或使用开源,搭建这么一套软件系统,既能让企业自己定制报表、分析图表,也能将制作好的分析报表展现出来;
l 分析工具的开发以企业自身为主,外购为辅。分析工具与业务特点、与人员使用习惯等因素紧密关联,其需求变化频率高,全部依赖外部厂家开发,则一方面费用较高,另一方面需求响应也不及时,可能等开发出来,分析的需求却没有了,因此企业要培养自己的开发队伍,可以利用数据市场中的数据开发出各类查询报表、分析图表等;
三.分析观点分享平台,让数据分析社交化。
大数据时代,在数据充裕的同时,带来了有价值分析结果的匮乏。数据分析,绝对不是高高在上的阳春白雪,而是需要人人参与、百家争鸣的氛围,要在企业内部树立人人都是分析师的理念。
分析观点分享平台的建设,采用类似于朋友圈、微博等社交媒体的机制,让每个人都有机会表达对数据的分析观点,通过转发、评论机制,让有价值的观点浮上来,在这个过程中,分享观点的个人可以获得成就感,转发、评论的人有参与感,企业从中获取到对运营决策有价值的想法,基于数据分析过程实现了科学、民主的决策。在建设分享平台的过程中,有几点需要注意:
l 人员关注机制。由于企业运营不同于互联网,存在着一定的封闭特性,不建议采用微博关注的开放性,而应该采用朋友圈类似的“关注-同意”的朋友机制,避免不适当的关注带来的信息泄露;
l 分享范围控制。由于企业数据的特殊性,员工在分析观点的时候需要控制分享范围,避免机密信息的泄露。控制分享范围,既要有人工控制,也要从平台层面通过权限控制,如财务数据的分享范围仅限某几个部门或人员等;
l 分享观点排序算法。综合多种因素对发表出来的观点进行排序,以便让展现到每个人眼前的都是最符合期望的内容,营造一个良好的分享环境,避免劣质内容驱逐优质观点给生态圈带来的毁灭性打击。
相信企业通过建设“两个市场,一个平台”,一定可以充分发现数据价值,在大数据的浪潮中游刃有余,真正实现数据运营、科学决策的管理模式,避免经验决策带来的错误。