BI-学习之 商业智能平台的引入(传统关系型数据库的问题)

早在 SQL Server 2005里面就有了这种 完整的商业智能平台了,那时候Nosql什么的都还停留在概念性的提出阶段,发展至2009年才一下子蹦了出来变得众所周知了。当然这个要扯就扯远了,咱们还是直接来介绍一下这篇文章的重点传统关系型数据库在当时面临的一些问题。

  • 关系型数据库的局限

  • SQL Server 2005 –完整的商业智能平台

  • 关系型数据库的局限:

随着信息技术的飞速发展,数据处理不仅在数量上要求越来越大,而且在质量上也要求越来越高,数据库所管理的数据已经发生了根本的变化。这一变化给数据库技术带来了巨大挑战,数据库管理的对象已不再仅限于文本数据等简单的数据类型,而需要描述和保存大量多媒体非结构化的复杂数据,以及数据间的关系。
此外,随着热门网站访问数量的激增,对数据库本身的存储机制、大量并发用户的使用需求、存储空间的使用效率、以及数据的完整性和安全性等方面都提出了更高要求。而这些都不是传统关系数据库中,使用二维表简单结构就可以满足的。

关系型数据库依据的是把数据表示为简单的两维模型,即表示为行与列的记录来进行存储处理。显然由于受到当时条件的限制,只是一种适合于对简单数据存储处理的技术,存在难以克服的局限性。
关系型数据库管理系统本身固有的局限性,表现在以下三个方面:

    1. 数据模型上的限制

    2. 性能上的限制

    3. 扩展伸缩性上的限制

1.数据模型上的限制:

关系数据库所采用的两维表数据模型,不能有效地处理在大多数事务处理应用中,典型存在的多维数据。其不可避免的结果是,在复杂方式下,相互作用表的数量激增,而且还不能很好地提供模拟现实数据关系的模型。
关系数据库由于其所用数据模型较多,还可能造成存储空间的海量增加和大量浪费,并且会导致系统的响应性能不断下降。而且,在现实数据中,有许多类型是关系数据库不能较好地处理的。

2.性能上的限制:

为静态应用例如报表生成,而设计的关系型数据库管理系统,并没有经过针对高效事务处理而进行的优化过程。其结果往往是某些关系型数据库产品,在对GUI和Web的事务处理过程中,没有达到预期的效果。除非增加更多的硬件投资,但这并不能从根本上解决问题。
用关系数据库的两维表数据模型,可以处理在大多数事务处理应用中的典型多维数据,但其结果往往是建立和使用大量的数据表格,仍很难建立起能模拟现实世界的数据模型。并且在数据需要作报表输出时,又要反过来将已分散设置的大量的两维数据表,再利用索引等技术进行表的连接后,才能找到全部所需的数据,而这又势必影响到应用系统的响应速度。

3.扩展伸缩性上的限制:

关系数据库技术在有效支持应用和数据复杂性上的能力是受限制的。关系数据库原先依据的规范化设计方法,对于复杂事务处理数据库系统的设计和性能优化来说,已经无能为力。此外,高昂的开发和维护费用也让企业难以承受。
除此之外,关系数据库的检索策略,如复合索引和并发锁定技术,在使用上会造成复杂性和局限性。

  • SQL Server 2005 –完整的商业智能平台

  1. SQL Server Analysis Services (SSAS)

  2. SQL Server Integration Services (SSIS)

  3. SQL Server Reporting Services(SSRS)

1.SQL Server Analysis Services (SSAS)

Microsoft SQL Server Analysis Services (SSAS)  为商业智能应用程序提供联机分析处理(OLAP) 和数据挖掘功能。Analysis Services 允许您设计、创建和管理包含从其他数据源(如关系数据库)聚合的数据的多维结构,以实现对OLAP 的支持。对于数据挖掘应用程序,Analysis Services 允许您设计、创建和可视化处理那些通过使用各种行业标准数据挖掘算法,并根据其他数据源构造出来的数据挖掘模型。

Analysis Services (SSAS) 体现结构

  • Analysis Services 的服务器组件作为Microsoft Windows 服务来实现。SQL Server Analysis Services 支持同一台计算机中的多个实例,每个Analysis Services 实例作为单独的Windows 服务实例来实现。
  • 客户端使用公用标准XML for Analysis (XMLA) 与Analysis Services 进行通信,XMLA 是一个基于SOAP 的协议,用于发出命令和接收响应,公开为一项Web 服务。此外,客户端对象模型通过XMLA(包括托管提供程序(ADOMD.Net) 和本机OLE DB 访问接口)进行提供。
  • 查询命令可使用下列方式发出:
    SQL;
    多维表达式(MDX)(一种面向分析的行业标准查询语言);或数据挖掘扩展插件(DMX)(一种面向数据挖掘的行业标准查询语言)。
    还可以使用Analysis Services 脚本语言(ASSL) 来管理Analysis Services 数据库对象。有关详细信息,请参阅Analysis Services Scripting Language (ASSL)
  • Analysis Services 还支持本地多维数据集引擎,该引擎允许断开连接的客户端中的应用程序在本地浏览已存储的多维数据。

2.SQL Server Integration Services (SSIS)

SQL Server Integration Services (SSIS) 是生成高性能数据集成解决方案(包括数据仓库的提取、转换和加载(ETL) 包)的平台。
用于生成和调试包的图形工具和向导;用于执行工作流函数(如FTP 操作)、执行SQL 语句或发送电子邮件的任务;用于提取和加载数据的数据源和目标;用于清理、聚合、合并和复制数据的转换;用于管理Integration Services 的管理服务Integration Services 服务;以及用于对Integration Services 对象模型编程的应用程序编程接口(API)。

Integration Services (SSIS) 体现结构

Microsoft SQL Server Integration Services (SSIS)
由四个关键部分组成:
1、Integration Services 服务
2、Integration Services 对象模型
3、Integration Services 运行时
4、运行时可执行文件以及封装数据流引擎和数据流组件的数据流任务。

3.SQL Server Reporting Services(SSRS)

SQL Server Reporting Services 提供有支持Web 的企业级报告功能,以便您创建能够从多种数据源获取内容的报表,以不同格式发布报表,并集中管理安全性和订阅。

Reporting Services (SSRS) 体现结构

SQL Server Reporting Services 是一组处理组件、工具和编程接口的集合,支持在托管环境中进行开发以及使用格式丰富的报表。该工具集包括部署工具、配置和管理工具以及报表查看工具。编程接口包括简单对象访问协议(SOAP)、URL 端点和Windows Management Instrumentation (WMI),可以轻松地与新的或现有的应用程序和入口集成。

本地多维数据集和本地挖掘模型支持

本地多维数据集和本地挖掘模型允许在客户端工作站与网络的连接断开时对该工作站进行分析。本地多维数据集引擎(Msmdlocal.dll) 支持客户机的本地多维数据集和本地挖掘模型。本地多维数据集引擎是进程内COM 服务器。客户端应用程序调用OLE DB for OLAP 访问接口,该接口将加载本地多维数据集引擎以创建和查询本地多维数据集,如下图中所示。

时间: 2024-10-13 05:10:50

BI-学习之 商业智能平台的引入(传统关系型数据库的问题)的相关文章

详细总结 Hive VS 传统关系型数据库

本文思路,看图说话,一张图,清晰总结二者区别 下面对图中的各条做详细总结 1.查询语言 不做赘述 2.数据存储位置 不做赘述 3.数据格式 Hive:Hive 中没有定义专门的数据格式,数据格式可以由用户指定,用户定义数据格式需要指定三个属性:列分隔符(通常为空格."\t"."\x001″).行分隔符("\n")以及读取文件数据的方法(Hive 中默认有三个文件格式 TextFile,SequenceFile 以及 RCFile). 由于在加载数据的过程中

MongoDB 与传统关系型数据库mysql比较

与关系型数据库相比,MongoDB的优点: 转载自  http://blog.sina.com.cn/s/blog_966e430001019s8v.html①弱一致性(最终一致),更能保证用户的访问速度:举例来说,在传统的关系型数据库中,一个COUNT类型的操作会锁定数据集,这样可以保证得到“当前”情况下的精确值.这在某些情况下,例 如通过ATM查看账户信息的时候很重要,但对于Wordnik来说,数据是不断更新和增长的,这种“精确”的保证几乎没有任何意义,反而会产生很大的延 迟.他们需要的是一

NoSQL数据库技术实战-第1章 NoSQL的数据一致性 传统关系型数据库的ACID

在看着章节的时候,我简单的回顾了一下关系型数据库的事务处理的ACID原则,其中原子性和持久性比较好理解.由于以前没有深入去研究.关于一致性和隔离性上我产生了疑问,在整理后分析如下: 一致性:书中所说的一致性是指数据库要保证事务处理前后,数据从一种一致的状态转移到另外一种一致的状态.书中举的例子是银行转账前后总账是不应该变化的.但是我困惑的是,转账前后总账的一致性应该是在应用程序中控制的,数据库怎么能保证呢?最后我的理解是,数据库本身不保证你的数据的一致性,但是它有一些处理,只要你的应用程序写法没

中小型企业商业智能平台的开发和实现(数据仓库、BI系统、真实项目实战)

中小型企业商业智能平台的开发和实现(数据仓库.BI系统.真实项目实战)课程分类:数据和数据仓库适合人群:初级课时数量:76课时用到技术:数据仓库.BI系统.真实项目实战涉及项目:中小型企业商业智能平台咨询QQ:1840215592课程内容简介:本课程以公共卫生领域高血压的管理为实际应用场景,为高血压管理系统建立数据仓库,进行数据分析.本课程一共分为四个章节,76讲.第一章主要介绍了商业智能系统的发展,从商业智能的学科范围.演化史.应用案例到自然演化式的体系结构,以及面临的问题,再讲到数据仓库以及

中小型企业商业智能平台的开发和实现

中小型企业商业智能平台的开发和实现(数据仓库.BI系统.真实项目实战)http://www.ibeifeng.com/goods-472.html咨询QQ2110053820课程讲师:鸿鹄 课程分类:数据和数据仓库适合人群:初级课时数量:76课时更新程度:完成用到技术:数据仓库.BI系统.真实项目实战涉及项目:中小型企业商业智能平台 本课程以公共卫生领域高血压的管理为实际应用场景,为高血压管理系统建立数据仓库,进行数据分析.本课程一共分为四个章节,76讲.第一章主要介绍了商业智能系统的发展,从商

caffe学习(1):多平台下安装配置caffe

caffe学习(1):多平台下安装配置caffe 提到deep learning, caffe的大名自然是如雷贯耳,当然,除了caffe之外,还有很多其他的框架,如torch,mxnet...但是,就我自己这一个月的实验以及师兄的结论都是,caffe得出的实验performance要高于别的框架,可能是C++的威力吧~笑 OK,接下来准备在这个系列分享我使用和学习caffe的一些经验,首先自然是框架的配置了.这里我们分享一下在windows10和ubuntu14.04虚拟机下的Caffe配置(:

Cocos2d-x 3.1.1 学习笔记(四)学习打包Android平台APK!

从cocos2dx 3.1项目打包成apk安卓应用文件,搭建安卓环境的步骤有点繁琐,但搭建一次之后,以后就会非常快捷! 一.下载Android环境 搭建Android环境需要用到Android SDK.NDK.Ant和JDK: Android SDK下载http://developer.android.com/sdk/index.html Android NDk下载http://developer.android.com/tools/sdk/ndk/index.html Android JDK下

C++学习——关于C++平台安装教程及新建项目

C++学习 ——关于C++平台安装教程及新建项目 一.平台下载 (1)资源 作为一个新手,安装方便操作方便的,dev C++是个很不错的选择,但是我认为唯一不足的地方就是背景外观很难受(下面会解释一哈!). 下载资源放到了百度网盘, 链接:https://pan.baidu.com/s/1d1jVR7DXAtTnNc7W507Igw 提取码:9vdm 如果有问题可以联系我! 接下来是安装教程! (2)安装教程 ①网盘文件提取出来后. ②这里的语言能看懂的只有英文.(不过不用担心,之后会可以设置成

欢迎一起翻译thingsboard 中文文档,一起学习thingsboard物联网平台

一起学习thingsboard物联网平台,有谁一起翻译Thingsboard文档吗?中文文档翻译项目: https://github.com/haiiiiiyun/thingsboard.cn, 项目中都列出了翻译进程,以及每篇内容的翻译贡献者. 通过翻译,不仅可以进不步了解 thingsboard,还能推广 thingsboard 在国内的使用. 为了能看到最新的翻译效果,我自建了个中文文档网站 thingsboard.atjiang.com, 可以看到最新的翻译. 原文地址:https://