hbase和zookeeper的安装和部署

1.概要

1.1HBase的使用场景

? 大数据量（100s TB级数据）且有快速随机访问的需求。

? 例如淘宝的交易历史记录。数据量巨大无容置疑，面向普通用户的请求必然要即时响应。

? 容量的优雅扩展。

? 大数据的驱使，动态扩展系统容量的必须的。例如：webPage DB。

? 业务场景简单，不需要关系数据库中很多特性（例如交叉列、交叉表，事务，连接等等）。

? 优化方面：合理设计rowkey。因为hbase的查询用rowkey是最高效的，也几乎的唯一生产环境可行的方式。所以把你的查询请求转换为查询rowkey的请求吧。

1.2软件准备

hbase-0.98.8 【下载地址】

zookeeper-3.4.6 【下载地址】

2.配置

sudo vi /etc/profile
HBASE_HOME=/home/hadoop/source/hbase-0.98.8
ZK_HOME=/home/hadoop/source/zookeeper-3.4.6
PATH=$HBASE_HOME/bin:$ZK_HOME/bin
export HBASE_HOME ZK_HOME

hbase-env.sh

export JAVA_HOME=/usr/jdk1.7

启动shell：

hbase shell

启动hbase：

start-hbase.sh

3.ZK

3.1概要

zk可以用来保证数据在zk集群之间事务性一致，如：

删除Server1中的数据后，其他集群的Server会自动同步删除之后的数据。

3.2安装

集群的规模小于等于3，各个集群的系统时间必须一致。
安装

（1）解压zk的压缩包到指定位置。

（2）修改conf文件，cp zoo_sample.cfg zoo.cfg

（3）编辑zoo.cfg 修改dataDir=/home/zk/data 新增 server.0=hadoop0:2888:3888 server.1=hadoop1:2888:3888 server.2=hadoop2:2888:3888

（4）创建文件夹 mkdir /home/zk/data 在data目录下，创建文件myid，值为0

（5）用scp命令分发zk文件夹到集群

3.3启动/验证

启动zk的服务：zkServer.sh start

验证zk的启动状态：zkServer.sh status

4奇数选举

zookeeper的集群数推荐配置奇数，Leader选举算法采用了Paxos协议，该协议的核心思想是当多数Server写成功时，则任务数据写成功，如：

有3个Server，则两个写成功即可；
有4或5个Server，则三个写成功即可；
如果有3个Server，则最多运行1个Server挂掉
如果有4个Server，则同样最多运行1个Server挂掉

由此，我们可以看出3台服务器和4台服务器的容灾能力是一样的，所以为了节约服务器资源，一般我们采用奇数个数，作为服务器部署个数。

时间： 2024-10-07 12:13:48

hbase和zookeeper的安装和部署的相关文章

zookeeper的安装与部署-伪集群

1.Zookeeper的下载与解压通过后面的链接下载Zookeeper: Zookeeper下载在此我们下载zookeeper-3.4.5下载后解压至安装目录下,本文我们解压到目录:/opt/zookeeper-3.4.8 $:tar -xzvf zookeeper-3.4.8.tar.gz -C /opt/ 如下图所示: 2.zookeeper的环境变量的配置: 为了今后操作方便,我们需要对Zookeeper的环境变量进行配置,方法如下:在/etc/profile文件中加入

ZooKeeper的安装与部署

本文讲述如何安装和部署ZooKeeper. 一.系统要求 ZooKeeper可以运行在多种系统平台上面,表1展示了zk支持的系统平台,以及在该平台上是否支持开发环境或者生产环境. 表1:ZooKeeper支持的运行平台系统开发环境生产环境 Linux 支持支持 Solaris 支持支持 FreeBSD 支持支持 Windows 支持不支持 MacOS 支持不支持 ZooKeeper是用Java编写的,运行在Java环境上,因此,在部署zk的机器上需要安装Java运行环境.为了正常

ubuntu18.04下Kafka安装与部署

Apache Kafka是分布式发布-订阅消息系统,Apache Kafka与传统消息系统相比,有以下不同: 它被设计为一个分布式系统,易于向外扩展:它同时为发布和订阅提供高吞吐量:它支持多订阅者,当失败时能自动平衡消费者:它将消息持久化到磁盘,因此可用于批量消费:本篇文章是基于Ubuntu18.04来安装Kafka. 一.安装Java更新软件包 sudo apt-get update安装openjdk-8-jdk sudo apt-get install openjdk-8-jdk查看java

[原创]HBase学习笔记（1）-安装和部署

HBase安装和部署使用的HBase版本是1.2.4 1.安装步骤(默认hdfs已安装好) # 下载并解压安装包 cd tools/ tar -zxf hbase-1.2.4-bin.tar.gz # 重命名为hbase mv hbase-1.2.4 hbase # 将hadoop目录下的hdfs-site.xml 和 core-stie.xml拷贝到 hbase下的conf 目录中 cd /home/work/tools/hbase/conf cp /home/work/tools/ha

详解HBase架构原理及安装部署步骤

一.什么是HBase HBase 是一个高可靠.高性能.面向列.可伸缩的分布式存储系统,利用Hbase技术可在廉价PC Server上搭建大规模结构化存储集群. HBase 是Google Bigtable 的开源实现,与Google Bigtable 利用GFS作为其文件存储系统类似, HBase 利用Hadoop HDFS 作为其文件存储系统:Google 运行MapReduce 来处理Bigtable中的海量数据, HBase 同样利用Hadoop MapReduce来处理HBase中的

HBase集成Zookeeper集群部署

大数据集群为了保证故障转移,一般通过zookeeper来整体协调管理,当节点数大于等于6个时推荐使用,接下来描述一下Hbase集群部署在zookeeper上的过程: 安装Hbase之前首先系统应该做通用的集群环境准备工作,这些是必须的: 1.集群中主机名必须正确配置,最好有实际意义:并且主机名都在hosts文件中对应主机IP,一一对应,不可缺少这里集群有6台服务器:bigdata1,bigdata2,bigdata3,bigdata4,bigdata5,bigdata6 这里是3台主机,分别对

Hbase原理架构与安装部署教程

1. HBase是什么 1.1 HBase的概念 HBase基于Google的BigTable论文,是建立的==HDFS==之上,提供高可靠性.高性能.列存储.可伸缩.实时读写的分布式数据库系统. 在需要==实时读写随机访问==超大规模数据集时,可以使用HBase. 1.2 HBase的特点 ==海量存储== 可以存储大批量的数据 ==列式存储== HBase表的数据是基于列族进行存储的,列族是在列的方向上的划分. ==极易扩展== 底层依赖HDFS,当磁盘空间不足的时候,只需要动态增加data

CentOS系统下Hadoop、Hbase、Zookeeper安装配置

最近两天给一个项目搭建linux下的大数据处理环境,系统是CentOS 6.3.主要是配置JDK,安装Tomcat,Hadoop.HBase和Zookeeper软件,本人在Hadoop这方面也是新手,配置这个环境遇到过许多问题,查了许多资料,这里做一个总结,以便日后回顾. 首先是账户权限的修改,安装软件环境需要上传文件和一些系统文件的修改权限,所以最好设置成root权限权限修改方法:http://www.linuxidc.com/Linux/2012-03/55629.htm 软件的安装,网上

zookeeper安装及部署

阅读目录一. 单机安装.配置二. 集群安装.配置安装及部署回到顶部一. 单机安装.配置 1.下载zookeeper二进制安装包下载 curl -L -O http://apache.fayea.com/zookeeper/stable/zookeeper-3.4.6.tar.gz 解压 tar zxvf zookeeper-3.4.6.tar.gz 2.设置环境变量 ZOOKEEPER_HOME关键字为添加的配置项 # /etc/profile # System wide envir