DW与DM

DW组成部分简介

DW的组成部分有:针对数据源的分析、数据的ETL、数据的存储结构,元数据管理等。

数据源分析

主要是分析要抽取哪些数据,如何抽取(全量还是增量)?它的更新周期是怎么样的?它的数据质量如何?

确定数据的格式,数据的域。

ETL

ETL之前需要知道以下内容,数据源有哪些系统,各个业务系统的RDBMS是什么?是否存在手工维护的数据?

数据抽取分为直接抽取和间接抽取两种 。

直接抽取:直接从业务数据库到DW,中间没有任何过渡,需要你知道业务系统的授权,表名等信息。

间接抽取:采用文件交换的方式,需要考虑网络连接,文件的位置,文件的格式,授权,文件内容完整性检查,文件的传输方式等。

元数据

主要包括技术元数据和业务元数据

技术元数据

有了这些数据,你就知道怎么开发DW,例如FRD,STTM(source to target mapping)等。

业务元数据

从业务角度描述了DW系统中的数据。帮助你理解各指标的含义,指标的计算方法等。如BRD。

DM(数据集市)的类型

1.独立型数据集市

数据直接来自于操作型数据库,为了满足特殊用户而建立的一种分析型环境。周期短,具有灵活性,但因为脱离 了DW,可能会导致信息孤岛的存在,不能以全局的视角分析数据。

2.从属型数据仓库

它的数据源是来自于EDW,开发周期长,但是结构上比较稳定,数据质量比较高,数据的一致性有保障。

DW和DM的区别

在数据结构上,DW是面向主题的,集成的数据的集合,而DM通常被定义成star或snowflake。

可以说,这是BI的两个鼻祖,innmon和kimball的思想在实现中的两个具体表现。

Inmmon的思想是自上而下建立完整的企业级的数据仓库。

RalphaKimball的思想是自下而上的建立数据仓库,建 的是DM,DM建得多了,自然就形成了DW。

时间: 2024-10-10 17:12:29

DW与DM的相关文章

DW,DM,ODS的区别

数据仓库的重要应用是将不同来源的数据和异构数据通过ETL整合在一起,为决策分析提供支撑,若在同一个数据库中分不同用户,此意义不大:假设所有有用户都在一个数据库里,如果因为某个原因数据库重启,那么会影响所有的应用,这违背了 SOA 设计理念中低耦合的思路,当然建在不同的库也是不好的,比如我们要有下钻操作,需要从DW层下钻到ODS层,多个库不方便查询和关联. 在当今这样一个信息技术发展迅速的时代,数据量也在不断的增长,面临这样的压力,总是会有大神提出一些解决方案.比如高层管理人员希望能查看整个公司的

对数据仓库ODS DW DM的理解

原文链接:https://www.jianshu.com/p/72e395d8cb33 今天看了一些专业的解释,还是对ODS.DW和DM认识不深刻,下班后花时间分别查了查它们的概念. ODS——操作性数据 DW——数据仓库 DM——数据集市 1.数据中心整体架构 数据中心整体架构 数据仓库的整理架构,各个系统的元数据通过ETL同步到操作性数据仓库ODS中,对ODS数据进行面向主题域建模形成DW(数据仓库),DM是针对某一个业务领域建立模型,具体用户(决策层)查看DM生成的报表. 2.数据仓库的O

DW数据仓库与ODS的区别

这两天接触到ODS,开始很纳闷,有了DW(Data Warehouse)干嘛还要ODS(Operational Data Store),于是不查不知道,一查吓一跳,这里面还有这么多道道,这里总结一下,当作学习了. 简单说:ODS 操作型数据存储,存储的是当前的数据情况,给使用者提供当前的状态,提供即时性的.操作性的.集成的全体信息的需求.DW 数据仓库存储是一个面向主题的,反映历史变化数据,用于支撑管理决策. 参考一:http://www.cnblogs.com/liqiu/p/4947801.

系统软键盘">Android在外接物理键盘时,如何强制调用系统软键盘?

第一次写,写的不好请见谅 物理键盘映射过程: 手机/system/usr/keylayout/*.kl :内核将keyCode映射成有含义的字符串KeycodeLabels.h : framework 将字符串映射成keyEvent的keyCodeframeworks/-/res/values/attrs.xml - 主要部分:android.jar 一.问题描述:当平板连接上蓝牙扫描枪(外接物理键盘)时候,不能弹出软键盘输入,需要打开系统的输入法选择界面关闭硬件物理键盘后才能调用弹出系统软键盘

搭建数据仓库第04篇:逻辑建模–1–概要

目录 前言 原则 内容 小结 前言 上一篇讲述了数据仓库模型设计中的业务建模和领域概念建模,接下来就自然而然的来到了逻辑数据建模LDM(Logical Data Model)的阶段,这个阶段可以说是建模最重要的一环(也就是维度建模).逻辑建模涉及到了整个数据仓库所有层次的模型设计,从DW到DM甚至到了OLAP.当然重点的设计还是在DW和DM层当中. 有些地方逻辑建模的范畴更加宽泛,包含了前面的业务主题和领域概念模型的设计(看下图). 本篇只是涉及了狭隘的部分(红色框住的部分). 内容 了解了逻辑

企业选择报表工具的必看点

我们都做过无数的报表,但却没有真正的了解过报表工具,也不知道怎么样的报表工具才算是好用的.可以真正解决我们需求的.用报表工具做数据,无疑就是想要让数据彻底的得到分析,让数据可视化.达到数据可视化可以让我们的决策者更好地做出利于企业发展的决策.原文出处:http://www.powerbi.com.cn/page103?article_id=253 现在传统报表的占比在各个行业内都在下降,越来越多的用户不太关注报表格式的严格性,而更在意数据,越是信息化程度高的行业越是如此.传统报表需求会有,但是会

数据仓库基础理论笔记

第一节 互联网电商大数据环境 如果你真正进入这个行业了! 入职后你所在部门一般叫:数据平台.数据中心.数据部 可能的团队:数据仓库组:BI(商业智能)组.某事业部数据组:架构组:数据专家组:... 部门里重要的几拨人,一拨是搭建和保证hadoop系统每天正常运行和改进hadoop系统的架构人员,这批人对hadoop细节非常熟悉,另一拨是满足业务系统需求,每天都在开发应用的开发人员,这批人员开发经验非常丰富, 业务流程也很熟悉,还有一拨是管理系统的上线下线运行监控授权等运营工作的运营人员,这批人可

论信息系统项目人力资源管理论文范文

论信息系统项目人力资源管理论文范文 摘要 2007年03月,笔者公司中标某某网省公司"SG186工程"的一体化企业级信息集成平台数据中心项目,此项目的总规模是1532万,其中软件实施费用982.4万,硬件费用549.6万:公司任命笔者作为该项目的项目经理负责全程的项目管理工作,该项目的主要目标是实现数据的"纵向贯通.横向集成",实现公司上上下下信息畅通和数据共享,同时为领导提供数据支撑服务和决策. 在充分分析了项目的特点之后,笔者认为对于项目的人力资源管理主要应遵从

数据仓库基础内容

一.数据仓库概念 将多数据源中的数据整合一起,进行数据分析,此时数据仓库对多种业务数据进行筛选和整合,可以用于数据分析.数据挖掘.数据报表.时效性T+1. 二.数据仓库的特点 主题性:数据仓库是针对某个主题来进行组织,比如滴滴出行,司机行为分析就是一个主题,所以可以将多种不同的数据源进行整合.而传统的数据库主要针对某个项目而言,数据相对分散和孤立. 集成性:数据仓库需要将多个数据源的数据存到一起,但是这些数据以前的存储方式不同,所以需要经过抽取.清洗.转换的过程 稳定性:保存的数据是一系列历史快