BI商业智能培训系列——(一)概述

简介:

BusinessIntelligence,简称 BI。

商业智能,是指用现代的技术进行数据分析,以实现商业价值,这些技术包括数据仓库技术,线上分析处理技术,数据挖掘,数据展现技术等.

以往的系统:

1、数据量大,而可用信息太少。

2、数据形成孤岛,无法形成紧密联系。

3、很难挖掘内在的联系,获得更有价值的信息。

4、改动困难,一旦需求稍有变动,工作量成倍增加。

以报表为例:

传统的报表系统技术上已经相当成熟,大家熟悉的Excel、水晶报表、Reporting Service等都已经被广泛使用。但是,随着数据的增多,需求的提高,传统报表系统面临的挑战也越来越多。

利用商业智能,可以从传统的写死的内容中摆脱出来.以报表为例,以往的报表做法是将前台的查询条件固定死,然后从数据库查询相应的数据,进行复杂的运算,最后在生成的报表中以表格,折线图或饼图的形式展现出来.而有了商业智能以后,查询条件可以自由变换,数据源也是如此,查询结果更加智能,更加方便。

相关概念:

DW——Data Warehouse 数据仓库,以往我们提到数据库是一个数据仓库,同样,BI同样涉及数据仓库,它的数据仓库是集成的相对稳定的。最重要的一点是,它是反三范式的。更夸张的说,它一点都不排斥数据冗余,更多的是用数据冗余来提高查询的效率。

DM——Data Mining 数据挖掘,高度自动化地分析企业原有的数据,做出归纳性的推理,从中挖掘出潜在的模式,预测客户的行为,帮助企业的决策者调整市场策略,减少风险,做出正确的决策。

ETL

E——Extract     抽取

T——Transform 转换

C——Cleaning   清洗

L——Load        装载

这一环节中,用户从数据源取出数据,经过数据清洗,最后按照事先定义好的模型加载进数据仓库的整个过程。

熟悉界面:

以VS 2010为例,BI下包括三种项目:SSIS,SSAS和SSRS。

SSIS——Integration Services

是一个平台,用来生成高性能数据集成解决方案。利用SSIS,你可以通过简单的拖拽控件来实现数据的操作处理。具体的示例将在下篇博客中详细介绍。

SSAS——Analysis Services

一个客户端工具,提供了设计、创建和管理来自数据仓库的多维数据集的功能,还提供对OLAP数据客户端访问功能。

SSRS——Reporting Services

一个基于服务器的综合性平台,集中式管理报表的速度、伸缩性和易管理性。可用于创建、管理和交付传统的书面报表和基于web的交互性报表。

小结:

BI,既然叫做商业智能或者说是商务智慧,它自然离不开商业的利润在其中。它的用途除了灵活方便的完成原有的传统实现方式外,更多的是挖掘潜在的利益关系,从中获取商业“信息”,为企业服务。理论知识简单介绍之后,下一篇是SSIS的介绍。

时间: 2024-10-13 07:47:09

BI商业智能培训系列——(一)概述的相关文章

BI商业智能培训系列——(三)SSAS入门

简介:     一个客户端工具,提供了设计.创建和管理来自数据仓库的多维数据集的功能,还提供对OLAP数据客户端访问功能. 解决方案如下: 相关概念: 维度: 维度可以理解为划分依据,简单的说就是看问题看数据的角度.维度通过属性和数据库的表挂钩,维度其实也就是属性的集合,这些属性是由数据源中表的列来提供.     数据表中主键,我们叫做键属性.除了键属性,其他的属性也有自己的等级或级别,叫做属性的层次结构.例如,在"日历时间"层次结构中,"日"级别应与"月

微软BI 之SSIS 系列 - 带有 Header 和 Trailer 的不规则的平面文件输出处理技巧

案例背景与需求介绍 之前做过一个美国的医疗保险的项目,保险提供商有大量的文件需要发送给比如像银行,医疗协会,第三方服务商等.比如像与银行交互的 ACH 文件,传送给协会的 ACH Credit 等文件.这些文件格式在美国都是开放的,通用的,可以直接到相关网站下载.也就是说像银行,协会等他们接受这种固定格式的文件,读取数据,读取公司编号进行业务来往或者记录.我当时就是直接在网上搜索到一个 PDF 格式的文件说明,大概有10来页,就是告诉你这个格式是如何定义,应该如何来处理的. 那么这种文件并非像我

微软BI 之SSIS 系列 - 对于平面文件中 NULL 值处理过程中容易极易混淆的几个细节

最近有人问我 OLE DB Destination 中的 Keep Nulls 如何控制 NULL 值的显示,为什么选中了 Keep Nulls 但是数据库中没有 NULL 值? 为什么在 Flat File Source 中勾选上了 Retain null values from the source as null values in the data flow 但是为什么目标表上显示的是一个当前日期,而不是 NULL 值等等,单开此文来解释这些非常容易混淆的概念. 在比较纯粹的 ETL 项

读懂BI商业智能与大数据应用的区别

之所以要区分大数据应用与BI(商业智能),是因为大数据应用与BI.数据挖掘等,并没有一个相对完整的认知. BI(BusinessIntelligence)即商务智能,它是一套完整的解决方案,用来将企业中现有的数据进行有效的整合,快速准确的提供报表并提出决策依据,帮助企业做出明智的业务经营决策. 伴随着BI的发展,是ETL,数据集成平台等概念的提出.ETL,Extraction Transformation Loading,数据提取.转换和加载,数据集成平台主要功能对各种业务数据进行抽取和相关转化

oschina BI商业智能开源软件

54款 BI商业智能开源软件 MySQL数据仓库解决方案 Infobright OLAP 分析引擎 Apache Kylin 数据处理和分发系统 Apache NiFi OLAP 数据查询引擎 Druid Analytics OLAP 存储和分析系统 Pinot OLAP报表展示标签库 JPivot BI套件 Pentaho 数据挖掘工作平台 Weka 数据仓库平台 Hive 进销存管理系统 SmPSS 数据挖掘工具 RapidMiner 商业智能套件 Palo BI Suite 数据仓库引擎

快速入门系列--MVC--01概述

虽然使用MVC已经不少年,相关技术的学习进行了多次,但是很多技术思路的理解其实都不够深入.其实就在MVC框架中有很多设计模式和设计思路的体现,例如DependencyResolver类就包含我们常见的DI依赖注入概念和注册表模式(GetService)等内容,ExceptionFilter等过滤器就体现AOP的概念,整个MVC内置了一个IOC容器,基本上所有的框架类的对象都是通过这种方式来创建的.此外,一直觉得很j2ee的spring很棒,其实如果大家很熟悉EHAB(微软企业开发库)的话,就会发

微软BI 之SSIS 系列 - 在 SSIS 中导入 ACCESS 数据库中的数据

开篇介绍 来自 天善学院 一个学员的问题,如何在 SSIS 中导入 ACCESS 数据表中的数据. 在 SSIS 中导入 ACCESS 数据库数据 ACCESS 实际上是一个轻量级的桌面数据库,直接使用文件形式存储.在国内大量使用 ACCESS 作为 BI 数据源并不多,但是在国外特别是美国使用的还比较多,因为他们的 IT 基础起步比较早.在我的第一个美国的医疗保险项目中,就遇到过大量的 ACCESS 数据源,前后总共有 500 多个 ACCESS 表.而现在从国外一些朋友反馈的情况仍然还有在使

微软BI 之SSIS 系列 - 使用 Script Component Destination 和 ADO.NET 解析不规则文件并插入数据

开篇介绍 这一篇文章是 微软BI 之SSIS 系列 - 带有 Header 和 Trailer 的不规则的平面文件输出处理技巧 的续篇,在上篇文章中介绍到了对于这种不规则文件输出的处理方式.比如下图中的这种不规则文件,第一行,第二行 Header 部分,第三行的内容 Content 部分,最后一行的 Trailer 部分. 在前几个课程 微软BI SSIS 2012 ETL 控件与案例精讲 第43,44,45,46 课中,我分别讲解了如何使用 .Script Component Source 解

微软BI 之SSIS 系列 - 使用 Script Task 访问非 Windows 验证下的 SMTP 服务器发送邮件

开篇介绍 大多数情况下我们的 SSIS 包都会配置在 SQL Agent Job 中周期性的按计划执行,比如每天晚上调用 SSIS 包刷新数据,处理 Cube 等.一旦 SSIS 包中出现任何异常,报错,那么配置在 SQL Agent Job 中的通知,邮件提醒就会把这些错误信息发邮件到指定的用户或者系统维护者,这样就起到了一个错误监控的作用. 但是在有的情况下,有一些自定义的 SSIS 调度框架的计划调度都不是通过 SQL Agent Job 配置来完成的.比如我以前在一个小项目中设计过一个