原po:http://blog.vsharing.com/EAP/A822259.html
1.创造数据
创造了四个excel表格,分别是client、material、sales data和sales organization。为了保持表头一致(因为暂时不是很清楚BW关联的读取方式),所以表头都用了中文。四表表头如下:
客户标识/客户名称/客户地址
物料编号/物料名称/物料描述
客户标识/销售代表标识/物料编号/销售单位/单位/销量/交易日期
销售区域/销售办公室/销售代表/销售代表标识
2.数据建模(这里看的是原po,但没看到图所以只是自己按它的字面理解)
InfoCube是根据星型结构进行建模的。事实表位于中间,维度表位于事实表周围。“本例中涉及‘客户’,‘物料’和‘销售代表’三个维度(实际上这里还有两个共有的维度,‘时间’和‘单位’)”。
3.ETTL过程
“1、抽取数据时,即完成从源系统(例如R/3系统)移出数据。该步的关键是识别合适的数据,因此,对于源数据系统很好的理解是基础。
2、数据传输时,有规则的将不同源数据系统的大量数据移动到数据仓库中,这里的关键是规划出一个符合实际的数据传输计划,并且拥有可靠的快速网络。
3、数据转换时,对数据要进行格式化处理,从而保证数据在数据仓库中保持一致。这里要面对众多挑战,不同的名称,不同的数据类型,不同的文件系统,不同的文件格式等,都需要在数据转换中正确处理。
4、数据加载,就是将数据正确、快速的加载到事实表中。这一过程的关键在于开发一个稳定的、好的错误处理程序。
ETTL是一个复杂的,需要花费大量时间的任务。任何错误都有可能危害到数据的质量,而数据质量直接影响到企业决策的制定,因此,对于数据仓库项目来说,能在计划的时间和既定的预算内完成具有很大的挑战。”
4.创建InfoCube
在BW中,使客户标志、物料编号、销售代表标识、度量单位以及交易日期成为characteristic,客户姓名和客户地址都是客户标识的属性(虽然它们实际上也是characteristic)。销售单价,销售数量和销售收益被称为主特征(key figure),特征和主特征都称为InfoObject。
即共创建七个characteristics和三个key figure。
然后在InfoProvider中创建一个InfoCube,在设计中我把三个key figures放进了Key Figures文件夹,把客户、物料和销售代表三者的ID放入维度1中,并重命名维度1为ID or Number维度。
5.把数据加载到Cube