1、简述数据仓库的设计步骤。
数据仓库规划(用户业务目标、仓库目标)和需求分析、建模、物理模型设计、部署、维护。
2、简述星型模式和雪花模式的区别。
一个事实、一组维表
一个事实、维表接维表
3、数据仓库三种模式之间的关系。
星型、雪花、星座
4、在设计数据仓库时,为什么确定事实表的粒度非常重要?
事实与粒度相匹配。
5、以下关于数据粒度的叙述中哪些是错误。
(1)粒度是指数据仓库小数据单元的详细程度和级别。
(2)数据越详细,粒度就越小,抽象级别也就越高。
(3)数据综合度越高,粒度就越大,抽象级别也就越高。
(4)粒度的具体划分将直接影响数据仓库中的数据量以及查询质量。
6、以下关于数据仓库开发特点的叙述中哪些是错误的。
(1)数据仓库开发要从数据出发。
业务需求
(2)数据仓库使用的需求在开发出来后才会明确。
先明确,再开发。设计时要能够应对未来的变化。
(3)数据仓库开发一个不断循环的过程。
(4)数据仓库中数据的分析和处理十分灵活,没有固定的开发模式。
7、以下关于数据仓库设计的说法中哪些是正确的。
(1)数据仓库项目的需求很难把握,所以不可能从用户的需求出发来进行数据仓库的设计,只能从数据出发进行设计。
(2)在进行数据仓库主题数据模型设计时,应该按部门业务应用的方式来设计数据模型。
(3)在进行数据仓库主题数据模型设计时要强调数据的集成性。
(4)在进行数据仓库概念模型设计时,需要设计实体关系图,给出数据表的划分,并给出每个属性的定义域。
8、维表中维有哪些类型?
结构维、信息维、分区维、分类维、退化维、一致维、父子维
9、在数据仓库的物理模型设计中,为什么要考虑维的概念分层?
多级汇总、深入洞察、不同用户不同维、灵活
10、在数据仓库的物理模型设计中,合并表组织策略有哪些好处?
节省I/O开销
思考:
1、源变化。
急:先处理、再分责
2、bottom-up/top-down
top-down:技术成熟、业务过程理解透彻。规范化程度高,最小化数据冗余与不一致性。便于全局。
周期长、见效慢;风险高。
bottom-up:见效快,投资少,灵活;由于部门需求简单,容易实现。
数据逐步清洗提炼。
原文地址:https://www.cnblogs.com/moqingtong/p/8284293.html