数据仓库

数据仓库是面向追的 集成的  时变的  非易失性的

OLAP  联机分析处理  目的是为了数据的分析和决策

OLTP  包含了大部分日常操作   是关系型数据库的主要任务是联机事务处理饿查询处理

数据立方体是指多维数据模型方体的集合

数据仓库常见的数据模型  :星型模式 雪花模式  事实星座模式

典型的OLAP操作    上卷  下钻 切片和切块 旋转  其他OLAP操作

数据仓库的三层体系结构:  数据仓库  OLAP服务器  前端工具

OLAM  联机分析挖掘

分为4层组成 数据存储层 多维数据库  OLAP层和用户接口层

时间: 2024-11-07 05:28:59

数据仓库的相关文章

漫谈大数据仓库与挖掘系统

任何比较关注业界新闻的人,都会知道最近一两年IT行业的几个关键字:移动端.LBS.SNS和大数据.前边三个,大家应该是很熟悉的,因为身边早已充斥着相关的应用.唯独最后一个大数据,在大部分人眼中却是非常陌生的,除了知道如数据挖掘.智能推荐等几个看似非常高深的词汇之外,却是不知其里的. 首先,笔者需要告诉大家,数据有什么价值.很多人可能认为,数据只是一堆数字,是没什么价值的.其实这些人很可能早已可能享受到数据的红利.例如早在2006年中旬上线的百度指数(index.baidu.com),其实就是一个

《数据仓库工具箱》——如何做好数据仓库

最近打算阅读一下数据仓库相关的书籍,百度了一下,有两本必读书<数据仓库工具箱>和<数据仓库>.简单介绍一下,<数据仓库>这本书更像是一本教材,里面的内容很经典:<数据仓库工具箱>看书名是一本单纯的工具书,其实里面都是实战.两本书各有千秋,我决定主要阅读<数据仓库工具箱>,今天分享第一章的内容,以后会做系列分享. 第一章主要介绍了维度建模的好处,Kimball的历史和技术架构,以及与其他类似架构的优劣,但其核心议题是:“如何做好数据仓库?” 说实话

什么是数据仓库总线架构

一.总线架构 维度建模的数据仓库中,有一个概念叫Bus Architecture,中文一般翻译为“总线架构”.总线架构是Kimball的多维体系结构(MD)中的三个关键性概念之一,另两个是一致性维度(Conformed Dimension)和一致性事实(Conformed Fact). 在多维体系结构(MD) 的数据仓库架构中,主导思想是分步建立数据仓库,由数据集市组合成企业的数据仓库.但是,在建立第一个数据集市前,架构师首先要做的就是设计出在整个企业内具有统一解释的标准化的维度和事实,即一致性

数据仓库中的几种模型

数据仓库中常见的模型有:范式建模,雪花模型,星型建模,事实星座模型. 星型模型 星型模型是数据集市维度建模中推荐的建模方法.星型模型是以事实表为中心,所有的维度表直接连接在事实表上,像星星一样.星型模型的特点是数据组织直观,执行效率高.因为在数据集市的建设过程中,数据经过了预处理,比如按照维度进行了汇总,排序等等,数据量减少,执行的效率就比较高. 雪花模型 雪花模型也是维度建模中的一种选择.雪花模型的维度表可以拥有其他维度表的,虽然这种模型相比星型模型更规范一些,但是由于这种模型不太容易理解,维

数据仓库之架构发展

数据仓库有很多类型的架构方式,按照发展的历程上,主要有如下几类标志性. 独立的数据集市架构. 在最早期的数据仓库建设中,大多是以部门为单位搭建数据仓库,也就是数据集市,供整个部门使用.这样能够很快的构建好数据仓库,但是缺点是很容易产生不同部门因数据计算口径不同而导致的数据产出结果不一致.当然对于小公司来讲,构建一个公司级的数据集市也是能够满足需求的. 联邦式的数据仓库架构.不同的部门构建出不同的数据集市,数据集市之间不能很好的进行整合,只能通过建立一定的映射关系来进行数据的交换,所以通过构建这种

数据库和数据仓库的区别

简而言之,数据库是面向事务的设计,数据仓库是面向主题设计的. 数据库一般存储在线交易数据,数据仓库存储的一般是历史数据. 数据库设计是尽量避免冗余,一般采用符合范式的规则来设计,数据仓库在设计是有意引入冗余,采用反范式的方式来设计. 数据库是为捕获数据而设计,数据仓库是为分析数据而设计,它的两个基本的元素是维表和事实表.维是看问题的角度,比如时间,部门,维表放的就是这些东西的定义,事实表里放着要查询的数据,同时有维的ID. 单 从概念上讲,有些晦涩.任何技术都是为应用服务的,结合应用可以很容易地

搞数据仓库的内心活动-第一篇

第一,没有工作经验,这个代表着我不知道怎么去进行工作,但是这个问题的根本就是我不一定不知道怎么去做,我如果能够展示出来我能够做好这个工作,那么应该是可以的,首先这个ETL代表着对数据的处理,处理涉及到数据,数据存放在数据库中,数据库分为事务型和分析性两种方向,两个数据库中存放数据会有不同的方式与架构,事务型中的数据存放架构为实体关系型,而分析型中的数据架构为事实维度型.在对数据进行处理前还要进行一定的处理,使得数据源拥有一定的格式,至少能够符合传入的接口,是格式化后的数据.所以这个源库中的数据本

数据仓库的多维数据模型

可能很多人理解的数据仓库就是基于多维数据模型构建,用于OLAP的数据平台,通过上一篇文章——数据仓库的基本架构,我们已经看到数据仓库的应用可能远不止这些.但不得不承认多维数据模型是数据仓库的一大特点,也是数据仓库应用和实现的一个重要的方面,通过在数据的组织和存储上的优化,使其更适用于分析型的数据查询和获取. 多维数据模型的定义和作用 多维数据模型是为了满足用户从多角度多层次进行数据查询和分析的需要而建立起来的基于事实和维的数据库模型,其基本的应用是为了实现OLAP(Online Analytic

第二章:数据仓库与数据集市建模

前言 数据仓库建模包含了几种数据建模技术,除了之前在数据库系列文章中介绍过的ER建模和关系建模,还包括专门针对数据仓库的维度建模技术. 本文将详细介绍数据仓库维度建模技术,并重点讨论三种基于ER建模/关系建模/维度建模的数据仓库总体建模体系:规范化数据仓库,维度建模数据仓库,以及独立数据集市. 维度建模的基本概念 维度建模(dimensional modeling)是专门用于分析型数据库.数据仓库.数据集市建模的方法. 它本身属于一种关系建模方法,但和之前在操作型数据库中介绍的关系建模方法相比增

数据挖掘与数据仓库之间的区别

数据挖掘技术是经由自动或半自动的方法探勘及分析大量的资料,以创建有效的模型及规则,而企业通过数据挖掘可以更加了解他们的客户,进而改进他们的行销.业务及客服的运作. 数据挖掘是数据仓库的一种重要运用.基本上,它是用来将你的资料中隐藏的资讯挖掘出来,所以 Data Mining 其实是所谓的 Knowledge Discovery 的一部份,Data Mining 使用了许多统计分析与 Modeling 的方法,到资料中寻找有用的特征(Patterns)以及关连性(Relationships). K