【Hadoop学习】Apache HBase项目简介

原创声明：转载请注明作者和原始链接 http://www.cnblogs.com/zhangningbo/p/4068957.html

英文原版：http://hbase.apache.org/

Apache HBase^TM ，即Hadoop 数据库，是一个分布式的、可缩放的大数据存储方案。

何时使用Apache HBase？

当需要随机、实时读写大数据时，就可以使用Apache HBase了。该项目旨在组织甚大规模的位于商业硬件集群之上的表——数十亿行 × 数百万列。Apache HBase是一个开源的、分布式的、版本化的、非关系型数据库，基于Google BigTable论文（A Distributed Storage System for Structured Data）来建模。就像BigTable借用GFS（Google File System）提供的分布式数据存储能力一样，Apache HBase也在Hadoop和HDFS之上提供了类似BigTable一样的能力。

特性

线性的和模块化的可扩展性
严格一致的读写
自动的和可配置的表分片
在RegionServer之间支持自动故障恢复
用Apache HBase表支持Hadoop MapReduce 任务的方便的基础类
客户端易用的Java API
块缓存和Bloom过滤器机制，支持实时查询
通过服务器端过滤器查询可以预测下推
Thrift 网关和REST-full Web服务，支持XML、protobuf和二进制数据编码选项
可扩展的jruby-based （JIRB）shell
支持通过Hadoop 测量子系统把测量导出至文件或者Ganglia；或者通过JMX

在哪里可以获得更多的信息？

查看架构概述，Apache HBase 参考手册FAQ，及其它文档。

参考阅读

1）HBase官方网站

2）HBase参考指南（官方文档英文版）

3）HBase参考指南（官方文档中文版，本人译）

4）HBase参考指南（官方文档中文版，周海汉，颜开）

时间： 2024-10-29 19:10:33

【Hadoop学习】Apache HBase项目简介的相关文章

Java Apache 开源项目简介

Apache Commons Apache Commons是Apache的一个开源项目,主要致力于各种可重用的Java组件.主要由以下三部分构成: The Commons Proper - 一个可重用的Java组件库(已经开发完的项目,一般我们导入相关jar包就可以使用) The Commons Sandbox - Java组件开发工作区(正在开发的项目) The Commons Dormant - 当前处于非活跃的Java组件库(其实就是还没开始开发) The Commons Proper 一

hadoop学习笔记----- Hbase理论

HBase Hbase是一个分布式的.面向列的开源数据库,该技术来源于Chang et al所写的Google论文"Bigtable:一个结构化数据的分布式存储系统". 就像Bigtable利用了Google文件系统(File System)所提供的分布式数据存储一样,HBase在Hadoop之上提供了类似于Bittable的能力. HBase是Apache的Hadoop项目的子项目. HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库,另一个不同的是HBase基

Hadoop学习之HBase和Hive的区别

Hive是为简化编写MapReduce程序而生的,使用MapReduce做过数据分析的人都知道,很多分析程序除业务逻辑不同外,程序流程基本一样.在这种情况下,就需要Hive这样的用户编程接口.Hive本身不存储和计算数据,它完全依赖於HDFS和MapReduce,Hive中的表纯逻辑表,就是些表的定义等,也就是表的元数据.使用SQL实现Hive是因为SQL大家都熟悉,转换成本低,类似作用的Pig就不是SQL. HBase为查询而生的,它通过组织起节点内所有机器的内存,提供一个超大的内存Has

Hadoop学习笔记—15.HBase框架学习（基础知识篇）

HBase是Apache Hadoop的数据库,能够对大型数据提供随机.实时的读写访问.HBase的目标是存储并处理大型的数据.HBase是一个开源的,分布式的,多版本的,面向列的存储模型,它存储的是松散型数据. 一.HBase:BigTable的开源实现 1.1 HBase出现的背景 (1)随着数据规模越来越大,大量业务场景开始考虑数据存储水平扩展,使得存储服务可以增加/删除,而目前的关系型数据库更专注于一台机器. (2)海量数据量存储成为瓶颈,单台机器无法负载大量数据. (3)单台机器IO读

Apache顶级项目介绍7 － HBase

今天我们来继续介绍Apache顶级项目大数据三巨头之一的HBase.恰逢今天(5.24)是HBase Con2016旧金山盛会,比较应景,而且还有朋友@Luke Han去演讲Kylin. 1. 官网简介: 老样子,HBase官网的介绍, "HBase is the Hadoop database, a distributed, scalable, big data store.",所以HBase = Hadoop Database,并且提供了分布式可扩展的数据存储.(HBase的

大数据学习系列之七 ----- Hadoop+Spark+Zookeeper+HBase+Hive集群搭建图文详解

引言在之前的大数据学习系列中,搭建了Hadoop+Spark+HBase+Hive 环境以及一些测试.其实要说的话,我开始学习大数据的时候,搭建的就是集群,并不是单机模式和伪分布式.至于为什么先写单机的搭建,是因为作为个人学习的话,单机已足以,好吧,说实话是自己的电脑不行,使用虚拟机实在太卡了... 整个的集群搭建是在公司的测试服务搭建的,在搭建的时候遇到各种各样的坑,当然也收获颇多.在成功搭建大数据集群之后,零零散散的做了写笔记,然后重新将这些笔记整理了下来.于是就有了本篇博文. 其实我在搭

大数据学习系列之七 ----- Hadoop+Spark+Zookeeper+HBase+Hive集

引言在之前的大数据学习系列中,搭建了Hadoop+Spark+HBase+Hive 环境以及一些测试.其实要说的话,我开始学习大数据的时候,搭建的就是集群,并不是单机模式和伪分布式.至于为什么先写单机的搭建,是因为作为个人学习的话,单机已足以,好吧,说实话是自己的电脑不行,使用虚拟机实在太卡了... 整个的集群搭建是在公司的测试服务搭建的,在搭建的时候遇到各种各样的坑,当然也收获颇多.在成功搭建大数据集群之后,零零散散的做了写笔记,然后重新将这些笔记整理了下来.于是就有了本篇博文. 其实我在搭

Hadoop学习之第六章节：Hbase配置安装

1.安装Hbase 1)下载,注意要与hadoop版本兼容,且选择稳定版较好 wget http://mirrors.hust.edu.cn/apache/hbase/hbase-0.98.5/hbase-0.98.5-hadoop2-bin.tar.gz 2)解压 tar -zxvf hbase-0.98.5-hadoop2-bin.tar.gz 3)修改conf/hbase-site.xml文件 <property> <name>hbase.rootdir</na

Hadoop重启，Hbase出现Master exiting的错误：org.apache.hadoop.hbase.master.HMasterCommandLine: Master exiting

hadoop hdfs 重新启动或者重新格式话,可能会出现一些数据丢失,报错hbase的. 我的是试验环境,所以需要重新清理这些数据. 首先要重新创建hbase在hdfs里面的文件夹: 并把赋予拥有者权限 $ sudo -u hdfs hadoop fs -mkdir /hbase $ sudo -u hdfs hadoop fs -chown hbase /hbase 清理hbase在zookeeper中的缓存数据,缓存的目录在hbase-site.xml中有. hbase启动出现错误: 20

猜你喜欢

三种标准库链接方式

Linux 应用程序因为 Linux 版本的众多与各自独立性,在工程制作与使用中必须熟练掌握如下两点才能有效地工作和理想地运行.1.Linux 下标准库链接的三种方式(全静态 , 半静态 (libgc ...

如何把apk编译时间和最后次git commit的sha值，写入到app中

需求背景:我们修复Bug的时候,频繁提交APK包,导致测试同学搞不清哪个包才是最新的比如一个版本3.0.1,我们可能后续基于这个版本陆续提交了好几个修复包同时,如果服务端ip地址能在界面上配置的话 ...

加载依赖的jar包在命令行编译和运行java文件

在命令里编译和执行java文件,当应用程序需要需要依赖的jar包里面的class文件才能编译运行的时候,应该这样做: 1. 首先是编译过程,在命令行里面执行: (1) javac -classpath ...

Elasticsearch聚合之 DateRange日期范围聚合

相比于range聚合,date range就是范围可以由时间来指定. 例如: { "aggs":{ "range":{ "date_range&quo ...

Html5 Selectors API

新QuerySelector方法 querySelector():根据指定的选择规则,返回在页面中找到的第一匹配元素 querySelectorAll():根据指定规则返回页面中所有相匹配的元素实例 ...

VM VirtualBox安装虚拟服务器

1.创建一个虚拟电脑 2.设置1024MB大小的内存 3.现在创建虚拟硬盘 4.选择硬盘文件类型 5.选择动态分配 6.选择文件位置(不要在系统盘"C盘"储存)

使用ajax()方法和后台交互

ajax()方法是jQuery底层的ajax实现,通过HTTP请求加载远程数据. 1 $.ajax({ 2 type: "GET", 3 url: "handleAjax ...

会话EJB系列(五)拦截器

上一篇文章<会话EJB系列(四)SessionBean事务管理>中,我们介绍了SessionBean的事务管理机制. 本文主题'拦截器',详细介绍其用途.作用.与Spring框架AOP的对 ...

hdu3713 Double Maze

Problem Description Unlike single maze, double maze requires a common sequence of commands to solve ...

【POJ3321】Apple Tree

树上单点修改,子树查询可以在这棵树的dfs序上建线段树维护 PS:modify.query的时候传入x的dfs序即可 1 #include<cstdio> 2 #include<c ...

C#中的虚方法和抽象方法（Thirteenth Day）

今天在云和学院学了很多,我这次只能先总结一下C#中的虚方法和抽象的运用. 理论: •用virtual修饰的方法叫做虚方法 •虚方法可以在子类中通过override关键字来重写 •常见的虚方法:ToSt ...

MotionEvent中getX()和getRawX()的区别

http://blog.csdn.net/ztp800201/article/details/17218067 public class Res extends Activity implements ...

数据转换技术的应用

北京红樱枫软件有限公司是一家日本企业在中国投资设立的独资软件开发公司.是目前国内数据文件格式转换领域的领先提供商.主要开发各种数据文件格式转换器.多媒体浏览器.纯文本抽出通用程序库.PDF文件生成程序 ...

二叉搜索树的第k个结点（剑指offer）

题目描述给定一颗二叉搜索树,请找出其中的第k大的结点.例如, 5 / \ 3 7 /\ /\ 2 4 6 8 中,按结点数值大小顺序第三个结点的值为4. 1 /* 2 struct TreeNode ...

LINUX/CENTOS 中修改SSH默认端口号

在linux中,默认的SSH端口号为22,由于这是大家都知道的端口号,一旦有入侵者进行端口扫描的时候扫描出22端口,就立马知道这是进行SSH登录的端口号,因此我们需要修改默认的端口号,让入侵者即使扫描 ...

nil/Nil/NULL/NSNull的区别

平时开发过程中经常遇到这几个表示空的关键字:nil.Nil.NULL,一向搞不清楚,作为一个有两年开发经验的程序员,连那么基础的东西都不知道未免太丢人了. 首先要说明的是,nil.Nil.NULL三个 ...

MySQL5.6配置文件详解

说明1,红色代表重点参数2,"全局缓存"."线程缓存",全局缓存是所有线程共享,线程缓存是每个线程连接上数据时创建一个线程(如果没有设置线程池),假如有200连 ...

VM虚拟机安装MAC OS

工具: 需要苹果系统运行一些插件 1.VMware 12 目前最新是12.5 2.Mac OS X 10.11 网上找了很多,资源都被删了,需要的就联系我吧.注意,要cdr格式的镜像文件,dmg格式有 ...

第四章布局管理

摘要: 涉及到布局管理中的一些函数 ---------------------------------------------------------- 1. void QWidget::setLay ...

Hibernate和Mybatis的区别（摘自博客园-----alicejiyayun）

目录(?)[-] 第一章 Hibernate与MyBatis 1 Hibernate 简介 2 MyBatis简介第二章开发对比开发速度开发社区开发工作量第三章系统调优对比 Hi ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.019 s.