在CDH5.14.2中安装Phoenix与使用

标签（空格分隔）：大数据平台构建

一：安装及配置Phoenix

二：Phoenix的基本操作

三：使用Phoenix bulkload数据到HBase

四：使用Phoenix从HBase中导出数据到HDFS

一：安装及配置Phoenix

1.0：phoienx 的介绍

Phoenix中文翻译为凤凰, 其最早是Salesforce的一个开源项目，Salesforce背景是一个搞ERP的，ERP软件一个很大的特点就是数据库操作，所以能搞出一个数据库中间件也是很正常的。而后，Phoenix成为Apache基金的顶级项目。

Phoenix具体是什么呢，其本质是用Java写的基于JDBC API操作HBase的开源SQL引擎

1.1：下载CDH 需要parcel包

下载地址：
  http://archive.cloudera.com/cloudera-labs/phoenix/parcels/latest/

  CLABS_PHOENIX-4.7.0-1.clabs_phoenix1.3.0.p0.000-el7.parcel

  CLABS_PHOENIX-4.7.0-1.clabs_phoenix1.3.0.p0.000-el7.parcel.sha1

  manifest.json

1.2 配置httpd的服务

yum install -y httpd* 

service httpd start 

chkconfig httpd on
mkdir -p /var/www/html/phoenix
mv CLABS_PHOENIX-4.7.0-1.clabs_phoenix1.3.0.p0.000-el7.parcel* /var/www/html/phoenix/

mv manifest.json /var/www/html/phoenix/

cd /var/www/html/phoenix/

mv CLABS_PHOENIX-4.7.0-1.clabs_phoenix1.3.0.p0.000-el7.parcel.sha1 CLABS_PHOENIX-4.7.0-1.clabs_phoenix1.3.0.p0.000-el7.parcel.sha

1.3 在CDH5.14.2 上面配置 phoenix

1.4 HBase服务需要部署客户端配置以及重启

1.5 phoeinx的连接操作

cd /opt/cloudera/parcels/CLABS_PHOENIX/bin

使用Phoenix登录HBase
./phoenix-sqlline.py

需要指定Zookeeper

./phoenix-sqlline.py node-01.flyfish:2181:/hbase

!table

二：Phoenix的基本操作

2.1 使用phoinex创建表

create table hbase_test
(
s1 varchar not null primary key,
s2 varchar,
s3 varchar,
s4 varchar
);

hbase 的接口登录

hbase shell

upsert into hbase_test values(‘1‘,‘testname‘,‘testname1‘,‘testname2‘);

upsert into hbase_test values(‘2‘,‘tom‘,‘jack‘,‘harry‘);

删除：
delete from hbase_test where s1=‘1‘; (删除是按rowkey)

upsert into hbase_test values(‘1‘,‘hadoop‘,‘hive‘,‘zookeeper‘);

upsert into hbase_test values(‘2‘,‘oozie‘,‘hue‘,‘spark‘);

更新数据测试，注意Phoenix中没有update语法，用upsert代替。插入多条数据需要执行多条upsert语句，没办法将所有的数据都写到一个“values”后面。

upsert into hbase_test values(‘1‘,‘zhangyy‘,‘hive‘,‘zookeeper‘);

三：使用Phoenix bulkload数据到HBase

3.1 准备测试文件

准备 导入的 测试文件
ls -ld ithbase.csv

head -n 1 ithbase.csv

上传到hdfs
su - hdfs

hdfs dfs -mkdir /flyfish

hdfs dfs -put ithbase.csv /flyfish

hdfs dfs -ls /flyfish

3.2 通过Phoenix创建表

create table ithbase
(
i_item_sk varchar not null primary key,
i_item_id varchar,
i_rec_start_varchar varchar,
i_rec_end_date varchar
);

执行bulkload命令导入数据

HADOOP_CLASSPATH=/opt/cloudera/parcels/CDH/lib/hbase/hbase-protocol-1.2.0-cdh5.12.1.jar:/opt/cloudera/parcels/CDH/lib/hbase/conf hadoop jar /opt/cloudera/parcels/CLABS_PHOENIX/lib/phoenix/phoenix-4.7.0-clabs-phoenix1.3.0-client.jar org.apache.phoenix.mapreduce.CsvBulkLoadTool -t ithbase -i /flyfish/ithbase.csv

select * from ithbase

四：使用Phoenix从HBase中导出数据到HDFS

cat export.pig
----
REGISTER /opt/cloudera/parcels/CLABS_PHOENIX/lib/phoenix/phoenix-4.7.0-clabs-phoenix1.3.0-client.jar;
rows = load ‘hbase://query/SELECT * FROM ITHBASE‘ USING org.apache.phoenix.pig.PhoenixHBaseLoader(‘node-01.flyfish:2181‘);
STORE rows INTO ‘flyfish1‘ USING PigStorage(‘,‘);
----
执行pig 

pig -x mapreduce export.pig

在hdfs 上面查看文件
hdfs dfs -ls /user/hdfs/flyfish1
hdfs dfs -cat /user/hdfs/flyfish1/part-m-00000

原文地址：http://blog.51cto.com/flyfish225/2127857

时间： 2024-11-05 13:36:03

在CDH5.14.2中安装Phoenix与使用的相关文章

在CDH5.14.4 中安装StreamSets与案例运行

在CDH5.14.4 中安装StreamSets与案例运行标签(空格分隔): 大数据平台构建一: Streamset 简介与系统环境介绍二: 安装软件准备三: 在CDH5.14.4 集成使用StreamSets 四: streamsets 基本使用案例运行一: Streamset 简介与系统环境介绍 1.1: StreamSet 简介 StreamSets由Informatica前首席产品官Girish Pancha和Cloudera前开发团队负责人Arvind Prabhakar于2

cdh5.14.2中集成安装kylin与使用测试

cdh5.14.2中集成安装kylin与使用测试标签(空格分隔): 大数据平台构建一:kylin 简介二:安装配置kylin 三:kylin 运行实例一:kylin 简介 Apache Kylin?是一个开源的分布式分析引擎,提供Hadoop/Spark之上的SQL查询接口及多维分析(OLAP)能力以支持超大规模数据,最初由eBay Inc. 开发并贡献至开源社区.它能在亚秒内查询巨大的Hive表. kylin 软件下载: 社区版kylin下载地址:https://archive.apa

在CDH5.14.2 中启用kudu的配置与验证

在CDH5.14.2 中启用kudu的配置标签(空格分隔): 大数据平台构建一: 系统平台介绍二: 安装kudu的集成一: 系统平台介绍 1.1. 关于kudu的介绍 Kudu是Cloudera开源的新型列式存储系统,是Apache Hadoop生态圈的新成员之一(incubating),专门为了对快速变化的数据进行快速的分析,填补了以往Hadoop存储层的空缺. Hadoop生态系统有很多组件,每一个组件有不同的功能.在现实场景中,用户往往需要同时部署很多Hadoop工具来解决同一个问

怎样在Ubuntu 14.04中安装Java（转）

想知道如何在Ubuntu 14.04中安装Java?安装Java肯定是安装Ubuntu 14.04后首先要做的几件事情之一(见http://www.linuxidc.com/Linux/2014-04/100398.htm),而且这也很简单. 许多人比较厌恶Java,但是很有可能因为某些原因你需要安装Java,尽管你很讨厌它.在这篇文章中,我们将展示如何在Ubuntu 14.04安装Java(也可能在Linux Mint 17同样适用). JRE vs OpenJDK vs Oracle JDK

点滴记录——Ubuntu 14.04中安装Sublime Text 3并使用SublimeClang插件

转载请说明出处:http://blog.csdn.net/cywosp/article/details/32721011 Sublime Text是个跨平台的编辑器,支持Windows.Linux.Mac系统平台,支持各种语言的代码编辑,配合上对应的插件,话上点时间学习,你将会对它爱不释手,大大的提高你的编码效率.本文将讲解在Ubuntu 14.04系统中安装SublimeText 3,并配置SublimeClang插件来配置C/C++开发环境. 1. Sublime Text 3的下载安装到

大数据平台CDH5.14.2 的安装配置

大数据平台CDH5.14.2 的安装配置标签(空格分隔): 大数据平台构建一:系统环境初始化二:安装CDH5.14.2 平台三:分配主机与分配角色一: 系统环境初始化 1.1: 系统环境介绍系统: CentOS7.5X64 cat /etc/hosts --- 172.17.100.11 node-01.flyfish 172.17.100.12 node-02.flyfish 172.17.100.13 node-03.flyfish 172.17.100.14 node-04.f

如何在Ubuntu 14.04中安装最新版Eclipse

想必很多开发人员都知道,Ubuntu 软件源中提供的并不是最新版本的 Eclipse,本教程就教大家如何在 Ubuntu 14.04 中快速安装 Eclipse 官方发布的最新版本. 到目前为止,Eclipse 的官方最新版本为 Eclipse Kepler (4.3.2),我们可以使用如下步骤在 Ubuntu 14.04 或其它 Ubuntu 版本中进行快速安装. 1.安装OpenJDK Java 7 如果你的系统中没有安装 Java,我们需要按如下步骤事先安装好 OpenJDK Java 7

ubuntu 14.04中安装 ruby on rails 环境（填坑版）呕血推荐

环境:在win7 上Vmware虚拟机环境中安装的ubuntu 14.04 开发相关: ruby 2.2.0 rails 4.2.0 sublime text 3 本文说明:所有的命令均在$ 之后,若$前边带有信息,只是为了方便你理解和与自己对照. 安装过程中由于这样那样的原因,产生许多坑,所谓坑是对初学者来说,大牛们飘过吧. 步骤1.从官网下载ubuntu 14.04 X64 http://124.205.69.136/files/2013000000502943/202.141.176.11