在CDH5.14.2 中启用kudu的配置与验证

在CDH5.14.2 中启用kudu的配置

标签(空格分隔): 大数据平台构建


  • 一: 系统平台介绍
  • 二: 安装kudu的集成

一: 系统平台介绍

1.1. 关于kudu的介绍

Kudu是Cloudera开源的新型列式存储系统,是Apache Hadoop生态圈的新成员之一(incubating),专门为了对快速变化的数据进行快速的分析,填补了以往Hadoop存储层的空缺。

  Hadoop生态系统有很多组件,每一个组件有不同的功能。在现实场景中,用户往往需要同时部署很多Hadoop工具来解决同一个问题,这种架构称为混合架构 (hybrid architecture)。比如,用户需要利用Hbase的快速插入、快读random access的特性来导入数据,HBase也允许用户对数据进行修改,HBase对于大量小规模查询也非常迅速。同时,用户使用HDFS/Parquet + Impala/Hive来对超大的数据集进行查询分析,对于这类场景, Parquet这种列式存储文件格式具有极大的优势。

  很多公司都成功地部署了HDFS/Parquet + HBase混合架构,然而这种架构较为复杂,而且在维护上也十分困难。首先,用户用Flume或Kafka等数据Ingest工具将数据导入HBase,用户可能在HBase上对数据做一些修改。然后每隔一段时间(每天或每周)将数据从Hbase中导入到Parquet文件,作为一个新的partition放在HDFS上,最后使用Impala等计算引擎进行查询,生成最终报表。


二: 安装kudu的集成

2.1 kudu 准备与下载

CDH从5.10开始,打包集成Kudu1.2,并且Cloudera正式提供支持。这个版本开始Kudu的安装较之前要简单很多,省去了Impala_Kudu,安装完Kudu,Impala即可直接操作Kudu。

CSD 包下载
软件下载: 
   http://archive.cloudera.com/kudu/csd/
   
 KUDU-5.10.2.jar

 parcel 包:

  http://archive.cloudera.com/kudu/parcels/5.12.2.8/
  
   KUDU-1.4.0-1.cdh5.12.2.p0.8-el7.parcel
   KUDU-1.4.0-1.cdh5.12.2.p0.8-el7.parcel.sha1
   manifest.json 
  

2.2 开始安装kudu

mv  KUDU-5.10.2.jar /opt/cloudera/csd/
chown cloudera-scm:cloudera-scm /opt/cloudera/csd/KUDU-5.10.2.jar

cd /opt/cloudera/csd/

chmod 644 KUDU-5.10.2.jar

配置httpd-server 

yum install -y httpd* 

service httpd start
chkconfig httpd on 

mv KUDU-1.4.0-1.cdh5.12.2.p0.8-el7.parcel* /var/www/html/kudu
mv manifest.json /var/www/html/kudu/

cd /var/www/html/kudu/
mv KUDU-1.4.0-1.cdh5.12.2.p0.8-el7.parcel.sha1 KUDU-1.4.0-1.cdh5.12.2.p0.8-el7.parcel.sha

2.3 通过CM界面配置Kudu的Parcel地址,并下载,分发,激活Kudu

2.4 kudu的验证: 使用impala 直接创建读取kudu上面的数据

impala-shell -i 172.17.100.11

create database kudu_test;


use kudu_test;

CREATE TABLE  my_first_table
 (
id BIGINT,
name STRING,
PRIMARY KEY(id)
)
PARTITION BY HASH  PARTITIONS 16
STORED AS KUDU;

INSERT INTO  my_first_table VALUES (99, "sarah");
INSERT INTO  my_first_table VALUES (100, "zhangyy");
INSERT INTO  my_first_table VALUES (200, "spark");

update my_first_table  set name=‘hadoop‘ where id=99;

原文地址:http://blog.51cto.com/flyfish225/2128004

时间: 2024-11-05 15:17:25

在CDH5.14.2 中启用kudu的配置与验证的相关文章

在CDH5.14.4 中安装StreamSets与案例运行

在CDH5.14.4 中安装StreamSets与案例运行 标签(空格分隔): 大数据平台构建 一: Streamset 简介与系统环境介绍 二: 安装软件准备 三: 在CDH5.14.4 集成使用StreamSets 四: streamsets 基本使用案例运行 一: Streamset 简介与系统环境介绍 1.1: StreamSet 简介 StreamSets由Informatica前首席产品官Girish Pancha和Cloudera前开发团队负责人Arvind Prabhakar于2

在Visual Studio 14 CTP中启用C# 6.0的新特性

今天看到Visual Studio 14 CTP版本已经发布了,支持了一些c++ 及C# 6.0的新特性,便下载下了尝鲜试了一下. C++到还好,使用C#的新特性就有点麻烦了,需要在csproj文件中加上这样一行才能使用     <LangVersion>experimental</LangVersion> 最开始我想写个VS插件来弄下.试了下找不到啥相关的API,便改写了一个小程序来转换它,使用了后还是觉得但文件太多时候很麻烦. 就干脆写了一个小程序把所有的模板中都添加了这一项,

在CDH5.14.2中安装Phoenix与使用

在CDH5.14.2中安装Phoenix与使用 标签(空格分隔): 大数据平台构建 一:安装及配置Phoenix 二:Phoenix的基本操作 三:使用Phoenix bulkload数据到HBase 四:使用Phoenix从HBase中导出数据到HDFS 一:安装及配置Phoenix 1.0:phoienx 的介绍 Phoenix中文翻译为凤凰, 其最早是Salesforce的一个开源项目,Salesforce背景是一个搞ERP的,ERP软件一个很大的特点就是数据库操作,所以能搞出一个数据库中

cdh5.14.2中集成安装kylin与使用测试

cdh5.14.2中集成安装kylin与使用测试 标签(空格分隔): 大数据平台构建 一:kylin 简介 二:安装配置kylin 三:kylin 运行实例 一:kylin 简介 Apache Kylin?是一个开源的分布式分析引擎,提供Hadoop/Spark之上的SQL查询接口及多维分析(OLAP)能力以支持超大规模数据,最初由eBay Inc. 开发并贡献至开源社区.它能在亚秒内查询巨大的Hive表. kylin 软件下载: 社区版kylin下载地址:https://archive.apa

HTTPS协议在Tomcat中启用是如何配置的

版权声明:本文为博主阿甘(Gane_Cheng)原创文章,欢迎转载,传播知识,请留言告知并注明出处,方便文章有误改正之后能找到原文.个人之言,请抱着怀疑的态度参考! 目录(?)[+] 转载请注明出处: http://blog.csdn.net/gane_cheng/article/details/53001846 http://www.ganecheng.tech/blog/53001846.html (浏览效果更好) 本文将讲解HTTPS协议在Tomcat中启用是如何配置的. 概念简介 Tom

Ubuntu 14.04中启用SSH服务

Ubuntu系统中默认没有启用SSH服务,但可以通过OpenSSH很容易启用该服务.OpenSSH是有OpenBSD项目组开发的一款建立SSH链接的开源软件. 1.在终端中执行下面命令即可 sudo apt-get install openssh-server 2.安装完成后,你可以在配置文件中更改端口.禁用root登陆或其他参数. sudo vim /etc/ssh/sshd_config 3.最后重启ssh服务器使之生效即可. sudo /etc/init.d/ssh restart

nginx php-fpm中启用慢日志配置(用于检测执行较慢的PHP脚本)

很多站长转到nginx+php-fpm后,饱受500,502问题困扰.当nginx收到如上错误码时,可以确定后端php-fpm解析php出了某种问题,比如,执行错误,执行超时. php-fpm.conf的配置文件中有一个参数request_slowlog_timeout是这样描述的 代码如下: ; The timeout for serving a single request after which a PHP backtrace will be; dumped to the 'slowlog

在Ubuntu 14.10中如何安装和配置‘天气信息指示器’

在Ubuntu桌面中有各种提供天气信息的方法,你可以使用Unity Dash和桌面应用来获得天气信息,比如 Typhoon . 但是可以提供快速查询天气状况和温度数据,并且只需要一次鼠标点击而获得大量气象数据的面板插件,才是到目前为止Linux平台下最受欢迎的天气应用. Atareao开发的 My Weather Indicator 就是这类应用中的一个,也可以说是最好的一个. 它在Unity面板上显示实时温度和天气状况,并且有一个包括体感温度.云量和日升日落时间等天气数据的菜单.除此之外,该应

PHP性能调优---php-fpm中启用慢日志配置(用于检测执行较慢的PHP脚本)

虽然通过nginx accesslog可以记录用户访问某个接口或者网页所消耗的时间,但是不能清晰地追踪到具体哪个位置或者说函数慢,所以通过php-fpm慢日志,slowlog设置可以让我们很好的看见哪些php进程速度太慢而导致的网站问题 php-fpm.conf的配置文件中有一个参数request_slowlog_timeout是这样描述的 ; The timeout for serving a single request after which a PHP backtrace will be