《BI那点儿事》数据仓库建模:星型模式、雪片模式

数据仓库建模 — 星型模式
Example of Star Schema

数据仓库建模 — 雪片模式
Example of Snowflake Schema

  • 节省存储空间
  • 一定程度上的范式


星形 vs.雪花型

  • Which one is better?
  1. 长期以来的争论
  2. 两种观点各有支持者
  3. 争论在继续……
  • 目前看来,大部分更加倾向于星型

支持星形维度的论点

  • 事实表总会是很大的,在维度表上节省的空间相对来说是很小的
  • 增加了数据模型的复杂度
  • 查询操作概念上更复杂了
  • 从数据仓库到多维数据库的加载时间会更长
  • 因此,只有当维度表极大,存储空间是个问题时,才考虑雪花型维度
  • 简而言之,最好就用星型维度即可

支持雪花型维度的论点

  • 从数据仓库到多维数据库的加载过程中,雪花型维度的效率更高;
  • 雪花型维度描述了更清晰的层次概念;
  • 只有当最终用户可能直接访问数据仓库时才考虑星形(而这是不被建议的);

我的个人经验

  • 星形结构效率上优于雪花型;
  • 多数情况下,我会选择星型,但是不排除使用雪花型的情况;
时间: 2024-11-05 12:14:47

《BI那点儿事》数据仓库建模:星型模式、雪片模式的相关文章

《BI那点儿事—数据的艺术》目录索引

转自:http://www.cnblogs.com/Bobby0322/p/4052495.html 原创·<BI那点儿事—数据的艺术>教程免费发布 各位园友,大家好,我是Bobby,在学习BI和开发的项目的过程中有一些感悟和想法,整理和编写了一些学习资料,本来只是内部学习使用,但为了方便更多的BI开发者,推动BI企业级应用开发,决定整理成一部教程,并在网络上免费发布该教程,希望为BI时代贡献绵薄之力! 本教程是由Bobby参考官方文档,综合市面相关书籍,经过充分的吸收消化,结合开发实践的而创

《BI那点儿事》Microsoft 神经网络算法

原文:<BI那点儿事>Microsoft 神经网络算法 Microsoft神经网络是迄今为止最强大.最复杂的算法.要想知道它有多复杂,请看SQL Server联机丛书对该算法的说明:“这个算法通过建立多层感知神经元网络,建立分类和回归挖掘模型.与Microsoft决策树算法类似,在给定了可预测属性的每个状态时, Microsoft神经网络算法计算输入属性每个可能状态的概率.然后可以用这些概率根据输入属性预测被预测属性的输出.”什么时候用这个算法呢?推荐在其他算法无法得出有意义的结果时再用,如提

《BI那点儿事》浅析十三种常用的数据挖掘的技术

原文:<BI那点儿事>浅析十三种常用的数据挖掘的技术 一.前沿 数据挖掘就是从大量的.不完全的.有噪声的.模糊的.随机的数据中,提取隐含在其中的.人们事先不知道的但又是潜在有用的信息和知识的过程.数据挖掘的任务是从数据集中发现模式,可以发现的模式有很多种,按功能可以分为两大类:预测性(Predictive)模式和描述性(Descriptive)模式.在应用中往往根据模式的实际作用细分为以下几种:分类,估值,预测,相关性分析,序列,时间序列,描述和可视化等. 数据挖掘涉及的学科领域和技术很多,有

《BI那点儿事》META DATA(元数据)

原文:<BI那点儿事>META DATA(元数据) 关于数据仓库的数据,指在数据仓库建设过程中所产生的有关数据源定义,目标定义,转换规则等相关的关键数据.同时元数据还包含关于数据含义的商业信息,所有这些信息都应当妥善保存,并很好地管理.为数据仓库的发展和使用提供方便.关于数据的数据,用于构造.维持.管理.和使用数据仓库,在数据仓库中尤为重要.不同 OLAP 组件中的数据和应用程序的结构模型.元数据描述 OLTP 数据库中的表.数据仓库和数据集市中的多维数据集这类对象,还记录哪些应用程序引用不同

数据仓库建模指南系列教程学习笔记

高质量数据建模的基本流程 概念模型确定系统边界,确定哪些做哪些不做 基本概念:实体.属性.域.关系.键.约束 ---------实体----------- 六合分析法:5W1H Who通常指与企业业务紧密联系的人员和组织 What通常指企业业务相关的“事”等 When更多的时候是以属性的模式出现的,而作为实体更多是以时间表的形式存在 Where指企业业务相关的地点,这个可以指具体的地点比如实体店,也可以指虚拟的网上商店 Why通常是指交易或者事件本身, 比如:销售.采购.订单等等 How通常是指

数据仓库建模方法初步

一.前言 数据仓库得建模方法同样也有很多种,每一种建模方法其实代表了哲学上的一个观点,代表了一种归 纳,概括世界的一种方法.目前业界较为流行的数据仓库的建模方法非常多,这里主要介绍范式建模法,维度建模法,实体建模法等几种方法,每种方法其实从本质 上讲就是从不同的角度看我们业务中的问题,不管从技术层面还是业务层面,其实代表的是哲学上的一种世界观.我们下面给大家详细介绍一下这些建模方法. 二.3NF范式建模方法 范式建模法其实是我们在构建数据模型常用的一个方法,该方法的主要由 Inmon 所提倡,主

FocusBI:租房分析&amp;星型模型

微信公众号:FocusBI关注可了解更多的商业智能.数据仓库.数据库开发.爬虫知识及沪深股市数据推送.问题或建议,请关注公众号发送消息留言;如果你觉得FocusBI对你有帮助,欢迎转发朋友圈或在文章末尾点赞[1] OLAP(联机分析处理)多维数据库与关系数据库的实体关系图表示形式所显示的内容完全不同.不同之处在于,对于用于构建OLAP数据库的架构类型,提供了一个名称:星型架构和雪花架构.雪花架构是在星型架构上经过大量的变形得到的.主要区别在于架构的复杂程度,OLTP架构一般都会比OLAP架构复杂

数据仓库建模

前言 数据仓库建模包含了几种数据建模技术,除了之前在数据库系列中介绍过的ER建模和关系建模,还包括专门针对数据仓库的维度建模技术. 本文将详细介绍数据仓库维度建模技术,并重点讨论三种基于ER建模/关系建模/维度建模的数据仓库总体建模体系:规范化数据仓库,维度建模数据仓库,以及独立数据集市. 回到顶部 维度建模的基本概念 维度建模(dimensional modeling)是专门用于分析型数据库.数据仓库.数据集市建模的方法. 它本身属于一种关系建模方法,但和之前在操作型数据库中介绍的关系建模方法

大数据数据仓库-独一无二的数据仓库建模指

简介: 本文的主要内容不是介绍现有的比较流行的主要行业的一些数据模型,而是将笔者在数据仓库建设项目中的一些经验,在这里分享给大家.希望帮助大家在数据仓库项目建设中总结出一套能够合乎目前业界规范的,满足大部分行业数据仓库建设标准的一种方法. 所谓水无定势,兵无常法.不同的行业,有不同行业的特点,因此,从业务角度看,其相应的数据模型是千差万别的.目前业界较为主流的是数据仓库厂商主要是 IBM 和 NCR,这两家公司的除了能够提供较为强大的数据仓库平台之外,也有各自的针对某个行业的数据模型. 例如,在