Kylin介绍3

Kylin

   is an open source Distributed Analytics Engine from eBay Inc。that provides SQL interface and multi-dimensional analysis (OLAP) on Hadoop supporting extremely large datasets

亮点

1.Compression and Encoding Support

2.Incremental Refresh of Cubes

3.Approximate Query Capability for distinct Count (HyperLogLog)

4.Leverage HBase Coprocessor for query latency

5.Job Management and Monitoring

6.Easy Web interface to manage, build, monitor and query cubes

7.Security capability to set ACL at Cube/Project Level

8.Support LDAP Integration

HyperLogLog:

时间: 2024-10-31 16:07:23

Kylin介绍3的相关文章

OLAP引擎——Kylin介绍

Kylin是ebay开发的一套OLAP系统,与Mondrian不同的是,它是一个MOLAP系统,主要用于支持大数据生态圈的数据分析业务,它主要是通过预计算的方式将用户设定的多维立方体缓存到HBase中(目前还仅支持hbase),这段时间对mondrian和kylin都进行了使用,发现这两个系统是时间和空间的一个权衡吧,mondrian是一个ROLAP系统,所有的查询可以通过实时的数据库查询完成,而不会有任何的预计算,大大节约了存储空间的要求(但是会有查询结果的缓存,目前是缓存在程序内存中,很容易

Kylin介绍 (很有用)

转:http://blog.csdn.net/yu616568/article/details/48103415 Kylin是ebay开发的一套OLAP系统,与Mondrian不同的是,它是一个MOLAP系统,主要用于支持大数据生态圈的数据分析业务,它主要是通过预计算的方式将用户设定的多维立方体缓存到HBase中(目前还仅支持hbase),这段时间对mondrian和kylin都进行了使用,发现这两个系统是时间和空间的一个权衡吧,mondrian是一个ROLAP系统,所有的查询可以通过实时的数据

Kylin介绍,功能特点【转】

Apache Kylin是一个开源的分布式分析引擎.完全由eBay Inc.中国团队开发 并贡献至开源社区.提供Hadoop之上的SQL查询接口及多维分析(MOLAP)能力以 支持大规模数据能在亚秒内查询巨大的Hive表(十亿百亿的海量数据). Apache Kylin社区发展 大数据分析面临的挑战 Huge volume data Table scan Big table joins Data shuffling Analysis on different granularity Runtim

HBase场景 | 都是HBase上的SQL引擎,Kylin和Phoenix有什么不同?

大数据时代,数据的价值越来越被重视,企业从海量大数据中挖掘所需要的信息,用来驱动业务决策以获得更大的商业价值.与此同时,出现了越来越多的大数据技术帮助企业进行大数据分析,例如 Apache Hadoop,Hive,Spark,Presto,Drill,以及今天我们即将介绍的 Apache Kylin 和 Apache Phoenix 项目等,都是使用 SQL 语言就可以分析大数据,极大地降低了大数据的使用门槛.这些大数据技术提供 SQL 查询接口,不只是因为 SQL 学习成本低,同时也和 SQL

一个 介绍 superset Kylin 以及大数据生态圈的 博文

superSet http://superset.apache.org/installation.html https://segmentfault.com/a/1190000005083953 https://www.jianshu.com/p/a6fe79d0b1b3 Kylin http://kylin.apache.org/cn/docs15/tutorial/create_cube.html https://www.csdn.net/article/2014-10-25/2822286

Kylin系列之二:原理介绍

2018年4月15日 15:52 因何而生 Kylin和hive的区别 1. hive主要是离线分析平台,适用于已经有成熟的报表体系,每天只要定时运行即可. 2. Kylin主要是MLOAP(多维在线分析平台).在线意味着提供快速的相应速度.主要适用于分析师不知道自己需要哪些数据,建立怎样的模型,需要不断的摸索,查询一致形成一个完整的模型和方案. 3. 通常的做法是在Kylin中进行数据的调研,探索,建立模型.形成固定模式后在hive中进行运行. 原理与架构 1. 基本原理是使用MR或者Spar

kylin 使用RESTful API 请求

目前根据Kylin的官方文档介绍,Kylin的认证是basic authentication,加密算法是Base64,在POST的header进行用户认证我使用的用户和密码是(格式:username:password) :ADMIN:KYLIN 使用Base64编码后结果为:QURNSU46S1lMSU4=1.在Linux环境下     curl -c cookiefile.txt -X POST -H "Authorization: Basic QURNSU46S1lMSU4="-H

Kylin如何进行JDBC方式访问或者调用

Kylin提供了标准的ODBC和JDBC接口,能够和传统BI工具进行很好的集成.分析师们可以用他们最熟悉的工具来享受Kylin带来的快速.我们也可以对它进行定制开发报表等,把kylin当做数据库服务器就行了. 首先我们来看一下连接Kylin的URL格式为: jdbc:kylin://<hostname>:<port>/<kylin_project_name> 注: 如果“ssl”为true话,那么上面的端口号应该为Kylin服务的HTTPS端口号. kylin_proj

Apache Kylin高级部分之使用Hive视图

本章节我们将介绍为什么需要在Kylin创建Cube过程中使用Hive视图:而如果使用Hive视图,能够带来什么好处,解决什么样的问题:以及需要学会如何使用视图,使用视图有什么限制等等. 1.      为什么需要使用视图 Kylin创建Cube的过程中使用Hive的表数据作为输入源.但是有些情况下,Hive中的表定义和数据并不能满足分析的需求,例如有些列的值需要进行处理,有些列的类型不满足需求,甚至有时候我们在创建Hive表时为了方便快捷,会将Hive表的所有列的字段类型都定义为string,因