阅读官网,学到哪就写到哪
1、需要先建立Model
2、kylin需要配置事实表,纬度表;可以自定义join。 我的用法和官方建议的不同,我是直接在hive中将所有的取join成一个单表,再根据单表进行cude kylin。 因为我的join的同时有一些业务上的处理。
3、需要选择cude的纬度字段和聚合的度量字段;纬度字段可以在所有的表中选择,度量字段只能在事实表中选择(度量字段就是被sum,avg,count的字段)
4、建立MODEL时,需要选择partition,一般是按天进行增量。
5、cude时,可以根据需求选择使用使用“层次”和“派生”,进行优化
1)、层次,添加字段之间的依赖,只能组合字段进行cube,减少cude的复杂度
2)、派生,将多字段组合成一个字段(即主键),根据主键进行查询。
3)、组合,指定组合字段,cube时按组合进行cube,减少cube的复杂度
6、
时间: 2024-10-28 04:54:13