Hadoop hive sqoop zookeeper hbase生产环境日志统计应用案例（Hive篇）

3、Hive安装配置

3.1安装MySQL

在datanode5上安装MySQL

# yum -y installmysql-server mysql

# mysql

mysql> grant all privileges on *.* [email protected]‘10.40.214.%‘ identified by "hive";

mysql> flush privileges;

3.2安装hive

# tar -zxf apache-hive-0.13.1-bin.tar.gz-C /var/data/; mv /var/data/apache-hive-0.13.1 /var/data/hive

# cd /var/data/hive

# vimbin/hive-config.sh ##在脚本开头添加下面的内容

exportJAVA_HOME=/usr/java/jdk1.7.0_71

exportHIVE_HOME=/var/data/hive

exportHADOOP_HOME=/var/data/Hadoop

# vim hive-site.xml ##配置hive

<name>hive.exec.scratchdir</name>

<description>Scratchspace for Hive jobs</description>

</property>

<name>hive.exec.local.scratchdir</name>

<description>Localscratch space for Hive jobs</description>

</property>

<name>javax.jdo.option.ConnectionURL</name>

<value>jdbc:mysql://10.40.214.9:3306/hive?createDatabaseIfNotExist=true</value>

<description>JDBCconnect string for a JDBC metastore</description>

</property>

<name>javax.jdo.option.ConnectionDriverName</name>

<value>org.apache.derby.jdbc.EmbeddedDriver</value>

<description>Driverclass name for a JDBC metastore</description>

</property>

<name>javax.jdo.PersistenceManagerFactoryClass</name>

<value>org.datanucleus.api.jdo.JDOPersistenceManagerFactory</value>

<description>classimplementing the jdo persistence</description>

</property>

<name>javax.jdo.option.DetachAllOnCommit</name>

<description>detachesall objects from session so that they can be used after transaction iscommitted</description>

</property>

<name>javax.jdo.option.NonTransactionalRead</name>

<description>readsoutside of transactions</description>

</property>

<name>javax.jdo.option.ConnectionUserName</name>

<description>usernameto use against metastore database</description>

</property>

<name>javax.jdo.option.ConnectionPassword</name>

<description>passwordto use against metastore database</description>

</property>

<name>hive.metastore.warehouse.dir</name>

<value>/user/hive/warehouse</value>

<description>locationof default database for the warehouse</description>

</property>

</configuration>

# cpmysql-connector-java-5.1.18-bin.jar /var/data/hive/lib/ ##加入MySQL java驱动jar包

# vim /etc/profile ##配置hive环境变量

#hivepath

exportHIVE_HOME=/var/data/hive

exportPATH=$PATH:$HIVE_HOME/bin

# source /etc/profile

# hive ##启动hive

3.3hive的使用

##创建库

# hive -e "createdatabase maillog;"

##创建表

# hive -e"create table maillog.izhenxin(mail_time string, message_id string,mail_to string, mail_domain string, mail_relay string, mail_delay string,mail_delays string,mail_dsn string, mail_status string) ROW FORMAT DELIMITEDFIELDS TERMINATED BY ‘|‘ STORED AS TEXTFILE;"

##删除表

# hive -e "droptable maillog.izhenxin;"

##导入数据到hive表中

# hive -e "LOADDATA LOCAL INPATH ‘/opt/zhangdh/to_result.txt‘ OVERWRITE INTO TABLEmaillog.izhenxin;"

##简单的数据查询

# hive -e "usemaillog;select * from izhenxin_total limit 10;"

##用hive统计数据，会执行mapreduce过程

# hive -e"select mail_domain,sum(case when mail_status=‘sent‘ then 1 else 0 end )sent,sum(case when mail_status=‘bounced‘ then 1 else 0 end ) bounced,sum(casewhen mail_status=‘deferred‘ then 1 else 0 end ) deferred from maillog.izhenxingroup by mail_domain order by sent desc;"

##将hive表数据的查询结果，添加到一个新表中

# hive -e"create table maillog.izhenxin_total(mail_domain string, sent_number int,bounced_number int, deferred int) ROW FORMAT DELIMITED FIELDS TERMINATED BY‘\t‘ STORED AS TEXTFILE;"

# hive -e "usemaillog; insert into table izhenxin_total select mail_domain,sum(case whenmail_status=‘sent‘ then 1 else 0 end ) sent,sum(case when mail_status=‘bounced‘then 1 else 0 end ) bounced,sum(case when mail_status=‘deferred‘ then 1 else 0end ) deferred from maillog.izhenxin group by mail_domain order by sentdesc;"

时间： 2024-10-14 15:47:02

Hadoop hive sqoop zookeeper hbase生产环境日志统计应用案例（Hive篇）

3、Hive安装配置

3.1安装MySQL

3.2安装hive

3.3hive的使用

Hadoop hive sqoop zookeeper hbase生产环境日志统计应用案例（Hive篇）的相关文章

Hadoop hive sqoop zookeeper hbase生产环境日志统计应用案例（Sqoop篇）

Spark集群框架搭建【VM15+CentOS7+Hadoop+Scala+Spark+Zookeeper+HBase+Hive】

生产环境日志审计解决方案

linux日志审计项目案例实战（生产环境日志审计项目解决方案）

CentOS（5.8/6.4）linux生产环境若干优化实战（实用篇）

大数据学习系列之七 ----- Hadoop+Spark+Zookeeper+HBase+Hive集群搭建图文详解

大数据学习系列之七 ----- Hadoop+Spark+Zookeeper+HBase+Hive集

hadoop-ha+zookeeper+hbase+hive+sqoop+flume+kafka+spark集群安装

Hadoop,Zookeeper,Hbase,Hive,Spark,Kafka,CDH，impala，azkaban，oozie，hue中webui常用端口