2017.06.29数据挖掘基础概念第四章

第四章
39、为什么在进行联机分析处理(OLAP)时，我们需要一个独立的数据仓库，而不是直接在日常操作的数据库上进行
1、提高两个系统的性能 2、操作数据库支持多事务的并发处理，需要并发控制和恢复机制，确保一致性和事务的鲁棒性
3、两者有着不同的数据的结构、内容和用法
40、什么是数据仓库
数据仓库是一种数据库，它与单位的操作数据库分别维护，数据仓库系统允许将各种应用系统集成在一起，为统一的历史数据分析提供坚实的平台，对信息处理提供支持，是一个面向主题的、集成的、时变得、非易失的数据集合，支持管理者的决策过程。
41、数据仓库的构建需要
1、数据集成 2、数据清理 3、数据统一
42、单位如何使用数据仓库的信息
1、提高顾客关注度，这包括顾客购买模式
2、根据按季度、按年、按地区的营销情况比较，重新配置产品和管理产品的投资，调整生产策略。
3、分析运作情况并找出利润源
4、管理客户联系，进行环境调整，管理公司的资产开销
43、OLTP（联机事务处理）和OLAP（联机分析处理）的主要区别
1、用户和系统的面向性：OLTP是面向顾客的 OLAP面向市场的
2、数据内容：OLTP系统管理当前数据 OLAP系统管理大量的历史数据
3、数据库设计：OLTP采用实体-联系数据模型和面向应用的数据库设计 OLAP通常采
用星形或雪花模型和面向主题的数据库设计
4、视图：OLTP系统主要关注一个企业或部门内部的当前数据，而不涉及历史数据或不
同单位的数据 OLAP系统处理来自不同单位的信息，以及多个数据库集成的信息。
5、访问模式：OLTP系统的访问主要由短的原子事务组成，OLAP系统的访问大部分是只读操作
44、数据仓库的三层体系结构
1、底层是仓库数据库服务器 2、中间层是OLAP服务器 3、顶层是前端客户层
45、数据仓库模型
1、企业仓库：企业仓库搜集了关于主题的所有信息，跨越整个企业
2、数据集市：数据集市包含企业范围数据的子集，对特定的用户群是有用的
3、虚拟仓库：操作数据库上视图的集合
46、数据仓库开发的自顶向下和自底向上的优缺点是什么？
自顶向下开发企业仓库是一种系统的解决方案，并能最大限度地减少集成问题。然而，它费用高，开发周期长，并且缺乏灵活性，因为整个组织就共同数据模型达成一致时比较困难的。设计、开发、配置独立的数据集市的自底向上的方法提供了灵活性、低花费，并能快速回报投资。然而，将分散的数据集市集成，形成一个一致的企业数据仓库时，可能导致问题。
47、数据仓库系统使用工具和程序的功能
1、数据提取 2、数据清理 3、数据变换 4、装入 5、刷新
48、元数据库包括的内容：
1、数据仓库结构描述 2、操作元数据 3、用于汇总的算法
4、由操作环境到数据仓库的映射 5、关于系统性能的数据 6、商务元数据
49、在OLAP中，如何使用概念分层
在多维数据模型中，数据组织在多维空间，每维包含由概念分层定义的多个抽象层。这种组织为用户从不同角度观察数据提供了灵活性
50、典型的OLAP操作方法
1、上卷 2、下钻 3、切片和切块
4、转轴 5、其他OLAP操作 6、OLAP系统与统计数据库

时间： 2025-01-02 17:02:07

2017.06.29数据挖掘基础概念第四章

2017.06.29数据挖掘基础概念第四章的相关文章

2017.06.29数据挖掘基础概念第二.三章

2017.06.29数据挖掘基础概念第十，十一章

2017.06.29数据挖掘基础概念第六，八，九章

2017.06.29 数据挖掘概念知识第一章

Java语言程序设计(基础篇) 第四章数学函数、字符和字符串

2017.07.06 IT项目管理笔记整理第四章

Work 2(演讲类) (2017.06.29)

《Python网络编程基础》第四章域名系统

2017.4.6课后作业（第四章.简答题4）