一文读懂商业智能(BI):企业数据分析的中枢

商业智能(BI)大家可能早已耳熟能详。从早期的报表自动化,到现在的复杂灵活分析,多平台支持,优秀的人机互动,多数据抽取,大数据整合,甚至和当下最火的人工智能都有结合点。可能一提到BI,大家都会自然而然地把这个话题丢给IT。但是由IT主导的BI项目最终是否能够落地?

为什么以技术为主导的IT部门做不好BI项目?

首先我认为BI是最直接,最重要地服务于商业决策者的,尤其是管理层。BI应用是否符合用户习惯,数据是否准确及时,是BI能否活下来的关键之关键。试想一个难以操作,挤满了图表,而且错误百出的BI应用,哪个经理会有兴趣去使用它?一旦失去存在的价值(credibility),被抛弃就成了自然而然的事情。

其次国内的IT人员普遍热衷于技术而忽略业务,对于很多开发人员来说,看InfoQ的兴趣要远大于CEO年终总结里的数字。由于业务知识和经验的缺失,很多时候IT闭门造车搞出来的BI应用根本不是业务人员需要的。慢慢地双方的激情消退,抵触情绪滋长,失败是早晚的事。

另外很多IT部门现在还停留在维护传统大型项目的框架里。当今的商业瞬息万变,与之配对的决策系统也应该具备灵活变化的能力。我相信很多商业决策者经历过类似的痛苦,例如从提出某个报表的修改意见到正式上线往往要等很长时间。但这不能完全怪IT,因为他们需要审批,获取权限,收集数据,测试,写文档 ... 。 所以一个小的修改可能要在6个月后release里才能实现。转型需要时间,但作为重要的决策者,您会等吗?

站在商业和IT之间,BI主要包含了什么?

国外很多大牛都定义过BI的框架。在此,我只是根据前人的经验和一些国内项目的经历总结出自己的内容。从下往上,我的BI各元素框架(BI Component Framework)主要分为3个部分:基础部分(Foundation),实现部分(Enablement),和辅助部分:

BI框架之基础部分(Foundation)

从业务层面来讲整个框架的根基应该是商业或者管理层的“觉醒”和授权。很多公司现在还依赖于excel报表。业务部门习惯于从excel中生成图表,粘贴到PPT里,然后把周报,月报,或者年报呈现给管理层。这样做会面临几个主要的问题:首先是数据的准确性。Excel报表肯定难以避免手工错误,而且在充满大量的 vLookup 或者公式的excel里找出错误是十分痛苦和低效的。其次是资源压力。越复杂的报告所需要的数据和人力越多。期限前集体赶报告的经历很多人应该都有吧。再次是时效性。商业决策讲究的是快速灵活。有些报告,例如公司年报确实不要求实时,但是很多底层的业务决策是不能等到周末或者月末才能开始制定的。最后是安全性。数据和分析结果全都在excel或PPT里。IT部门可以限制email,封锁网盘,但是直接考取那?面对这些问题,管理层必须思考是否需要一个完备的BI系统。

BI应用的灵魂来自于数据。数据就好似血液一样支撑着整个BI系统。但很多时候公司的数据是最为敏感的,例如供应商数据或财务数据。此外一些部门会把数据当成“私有财产”而拒绝或者有限度地与其他部门分享。单纯的BI实施团队(不管是IT主导还是业务主导),在没有高层甚至顶层授权的情况下很难持续地推动BI项目。因此管理层的“觉醒”和授权是我认为完成一个BI项目最优先,最重要的基础。

接下来是了解公司业务。前面已经说过了,IT部门通常精于前沿的技术而忽略业务,但是BI作为业务部门最直接的决策工具,失去了业务的支撑就好比给一个厌食症患者做了一桌子满汉全席。业务的构成有很多,例如公司有哪些KPI,各个部门的核心业务是什么,报告流程是什么,瓶颈在哪里,业务流程都需要哪些职能,是否需要内外合作等等。对于业务的理解,IT技术人员容易习惯性地用用例图(use case)或者系统架构图(system architecture)来表达。但是问一下哪一个经理或者业务员能一下子看懂那些圆圆圈圈代表的意思?在这里我的经验是用最传统的流程图和excel列表,因为大部分非IT人员基本不需要工程培训就可以轻松的理解你要表达的意思。

了解公司的系统和数据是重点。现在只有极罕见的公司还仅使用office或者手工作业,基本上大家都多多少少有些系统,一些大的公司甚至会上马全套的ERP,sales force,CRM等。对BI团队来说,系统本身的迭代,之间的接口,承载能力,权限设置,技术特点等都是需要了解的。数据分析则需要更多的精力。从范围来说除了分析系统内已有的数据,BI团队还要了解手工生成的数据,例如excel报表。从属性来说要分析数据的历史情况,数据的完整性,数据质量,数据层级(hierarchy),数据从属,维度变化(包含缓慢变化维的情况)等等。根据目前的经验,我遇到的数据分析最大的痛点:一是数据质量,尤其是历史数据。很多业务部门,尤其是缺乏控制的部门,其数据都是五花八门的。在清洗的时候会遇到各种问题。二是数据定义。很多公司没有主数据系统,或者根本不遵循主数据。同样一个主体,这个部门或系统定义这个code,另一个部门或系统使用别的code。在数据需要联通的时候我们需要耗费大量的时间去协调和校对。

分析完公司的业务,系统和数据之后真正的难点来了:整合。之前的分析都可以是独立的,但是在这里我们必须在熟知公司业务和数据的情况下把所有信息整合在一起。例如我们要知道在每一个流程里数据进口在哪里,出口在哪里,谁生成数据,谁更新数据,谁使用数据,怎么使用的,同样的数据是否被重复定义或多次使用,主数据是什么,数据属性又是什么等。我认为这个时候BI团队还是要更多的和业务部门坐在一起,交流的方式还是以流程图为主,只不过更加复杂,例如加入数据流和不同的人物信息。描述数据情况的时候则不拘于形式,但要把现状和问题说明白,千万不可以隐藏,否则将来的BI系统一定是垃圾进,垃圾出(rubbish in,rubbish out)。

在以上元素都介绍完之后,我们终于可以和IT坐下来谈谈感情,顺便聊一下数据存储,建模以及BI工具的实施了。

数据不会像水一样从源头直接流进BI系统。通常我们需要通过一个叫做ETL(技术术语,全拼是Extraction,Transformation,Loading)的流程来把数据从源头抓取到BI的数据仓库(data warehouse)。除了业务部门的终端系统和数据之外还有各种介于“中间层”的辅助数据,例如主数据,也要通过ETL流程把它们保存到BI仓库里。不同的IT部门会使用不同的技术来实现数据仓库,例如MySQL,微软的SQL,或者云端的数据库技术等等。

BI建模和普通的数据库建模有很大区别。一般系统数据库建模更多的是考虑数据存储,而BI本身只消费数据,其模型主要是为了服务将来的报表和分析。因此负责BI建模的架构师除了能够驾驭两种数据库的思维之外,还要有很强的技术能力和业务理解力。好的模型除了能针对不同的业务需求做出快速反应之外,还要有足够的拓展性以防备未来的业务变更或者新需求。因此好的数据建模师特别值钱。

有了BI所依赖的数据仓库和模型之后,我们可以开始用BI工具来开发对业务用户有意义的信息和应用。别忘了到目前为止大多数业务部门和管理层是不知道或者看不懂BI团队在干什么的,直到我们在屏幕上把表格或者图形做出来。BI工具有很多种,例如传统的SAP,IBM,Oracle等提供的重型BI工具,也包括时下流行的新型工具,例如QlikView,Tableau,PowerBI还有帆软公司的FineBI等等。当然一些大公司也可以使用自己开发的BI工具。

当数据、模型和工具都敲定之后,之后就可以开始真正的BI实施了。

时间: 2024-10-24 13:03:06

一文读懂商业智能(BI):企业数据分析的中枢的相关文章

关于BI商业智能的“8大问”|一文读懂大数据BI

这里不再阐述商业智能的概念了,关于BI,就从过往的了解,搜索以及知乎的一些问答,大家困惑的点主要集中于大数据与BI的关系,BI的一些技术问题,以及BI行业和个人职业前景的发展.这里归纳成8个问题点,每个问题都做了精心的解答,希望能给大家带来帮助. 问题1:商业智能BI和大数据是什么关系,如何选择? BI(BusinessIntelligence)即商业智能,它是一套完整的解决方案,用来将企业中现有的数据进行有效的整合,快速准确的提供报表并提出决策依据,帮助企业做出明智的业务经营决策. 大数据(B

区块链产业生态、存在问题及政策建议|一文读懂新趋势

区块链产业生态.存在问题及政策建议|一文读懂新趋势 2017-03-03 09:47:50  来源: 腾讯研究院抢沙发 摘要:从技术上来讲,区块链是一种分布式的记账方法.说到记账,我们经历了从实物记账向电子记账的演变关键词: 区块链 中国信息通信研究院与腾讯研究院区块链联合课题组 卿苏德,中国信息通信研究院区块链研究团队研究员,主要研究方向为区块链和人工智能等. 一.区块链技术原理和发展趋势 01| 区块链--一种分布式记账方法 从技术上来讲,区块链是一种分布式的记账方法.说到记账,我们经历了从

从HTTP/0.9到HTTP/2:一文读懂HTTP协议的历史演变和设计思路

本文原作者阮一峰,作者博客:ruanyifeng.com. 1.引言 HTTP 协议是最重要的互联网基础协议之一,它从最初的仅为浏览网页的目的进化到现在,已经是短连接通信的事实工业标准,最新版本 HTTP/2 更是让它再次成为技术热点. 作为即时通讯开发者来说,深刻理解HTTP协议有助于在现今复杂移动网络环境下的优化和最佳实践的开展,本文将通俗易懂的地介绍 HTTP 协议的历史演变和设计思路. 学习交流: - 即时通讯开发交流3群:185926912[推荐] - 移动端IM开发入门文章:<新手入

一文读懂高性能网络编程中的I/O模型

1.前言 随着互联网的发展,面对海量用户高并发业务,传统的阻塞式的服务端架构模式已经无能为力.本文(和下篇<高性能网络编程(六):一文读懂高性能网络编程中的线程模型>)旨在为大家提供有用的高性能网络编程的I/O模型概览以及网络服务进程模型的比较,以揭开设计和实现高性能网络架构的神秘面纱. 限于篇幅原因,请将本文与<高性能网络编程(六):一文读懂高性能网络编程中的线程模型>连起来读,这样会让知识更连贯. 学习交流: - 即时通讯开发交流3群:185926912[推荐] - 移动端IM

[转帖]一文读懂 HTTP/2

一文读懂 HTTP/2 http://support.upyun.com/hc/kb/article/1048799/ 又小拍 ? 发表于:2017年05月18日 15:34:45 ? 更新于:2017年05月24日 15:06:11 今天,HTTP 1.1 已经变成互联网中主要的协议.但是在 HTTP 协议诞生初期却被认为是简单直接的协议.1996 年在 RFC 1945 中定义了 HTTP 1.0 规范,仅 60 页,到 1999 年在 RFC 2616 定义了 HTTP 1.1,增长到了

一文读懂阻塞、非阻塞、同步、异步IO

原文:一文读懂阻塞.非阻塞.同步.异步IO 介绍 在谈及网络IO的时候总避不开阻塞.非阻塞.同步.异步.IO多路复用.select.poll.epoll等这几个词语.在面试的时候也会被经常问到这几个的区别.本文就来讲一下这几个词语的含义.区别以及使用方式.Unix网络编程一书中作者给出了五种IO模型:1.BlockingIO - 阻塞IO2.NoneBlockingIO - 非阻塞IO3.IO multiplexing - IO多路复用4.signal driven IO - 信号驱动IO5.a

[转帖]MerkleDAG全面解析 一文读懂什么是默克尔有向无环图

MerkleDAG全面解析 一文读懂什么是默克尔有向无环图 2018-08-16 15:58区块链/技术 MerkleDAG作为IPFS的核心数据结构,它融合了Merkle Tree和DAG的优点,今天阿信带大家一起来探究什么是MerkleDAG,拆分解说Merkle Tree.DAG有向无环图.MerkleDAG在IPFS中的应用. MerkleDAG树形结构图 Merkle Tree Merkle Tree是由美国计算机学家Merkle于1979年申请的专利. Merkle Tree通常也被

一文读懂前端与HTML5技术的区别!

一文读懂前端与HTML5技术的区别! 现在好多人都把HTML5和前端的概念弄混淆了.例如,H5是HTML5的简称,而现在好多人把HTML5看成了是前端开发的总称.到底前端和HTML5有哪些区别? 什么是前端开发 以一个网站为例包括网站设计.前端开发.程序开发等.网站设计就是网站的外观,平面的东西.程序开发也好理解就是功能实现.而前端开发,简单来说,就是把平面效果图转换成网页,把静态转换成动态.它的工作包括了:切图.写样式.做鼠标效果和图片切换效果等.而优秀的前端开发可以保障实现这些效果的同时,即

[转帖]一文读懂分布式架构知识体系(内含超全核心知识大图)

一文读懂分布式架构知识体系(内含超全核心知识大图) https://yq.aliyun.com/articles/721007?spm=a2c4e.11153959.0.0.2f464977X7lSdH 作者 | 晓土  阿里巴巴高级工程师 姊妹篇阅读推荐:<云原生时代,分布式系统设计必备知识图谱(内含22个知识点)> 导读:本文力求从分布式基础理论.架构设计模式.工程应用.部署运维.业界方案这几大方面,介绍基于 MSA(微服务架构)的分布式知识体系大纲,从而对 SOA 到 MSA 进化有着立