HDInsight HBase的概述

HDInsight HBase的概述

什么是HBase的?

HBase的是建立在Hadoop的Apache的开源的NoSQL数据库,提供了大量的非结构化和半结构化数据的随机存取和强大的一致性。它是仿照谷歌的BigTable是一个列面向家庭的数据库。数据被存储在一排内的表和数据的行是由列族分组。 HBase的是在这个意义上,无论是列也不存储在其中的数据类型需要在使用它们之前所定义的模式的更小的数据库。开放源代码是首次发布由Mike Cafarella于2007年,线性扩展处理PB级数据数千个节点。它可以依靠数据冗余,批处理和通过在Hadoop的生态系统的分布式应用程序提供的其他功能。

什么是Azure的HDInsight HBase的?

HDInsight HBase的是提供一个管理的集群集成到Azure的环境。集群被配置为直接在Azure的Blob存储,这提供了在性能/成本的选择低延迟和增加的弹性存储数据。这使客户能够建立一个大型数据集工作的互动式网站,构建存储传感器和遥测数据,从数以百万计的端点的服务,并分析这些数据与Hadoop作业。 HBase的和Hadoop的都是很好的出发点,在Azure的大数据项目,特别是,可以实现实时应用与大型数据集工作。

在HDInsight实现利用的HBase的横向扩展架构,可提供自动分片表,强一致性读取和写入,并自动故障转移。性能提高了内存高速缓存的读取和高吞吐量数据流写入。虚拟网络配置也可用于HDInsight HBase的。有关详细信息,请参阅提供HDInsight集群在Azure虚拟网络

如何在HDInsight HBase的数据管理?

数据可以在HBase的使用创造GET,PUT和Scan从HBase的shell命令来管理。数据使用付诸表决,并阅读使用get命令写入到数据库中。Scan命令被用于获得在表中从多行的数据。数据也可以使用HBase的C#的API,它提供了一个客户机库上HBase的REST API之上管理。一个HBase的数据库也可以使用配置单元查询。的介绍,这些编程模型,请参阅获取使用HBase的用Hadoop的HDInsight开始。协处理器也可以允许在数据库所在的节点数据的处理。

场景:什么是用例HBase的?

BigTable的,并推而广之,HBase的创建为其典型使用案例就是网络搜索。搜索引擎建立一个映射条款,包含它们的网页索引。但也有许多其他的用例HBase的适合哪几个的,都逐项列出在本节。

用例#1:key-value存储

HBase的可作为一个键值存储,适用于管理信息系统。 Facebook的使用HBase的为自己的邮件系统,它是理想的存储和管理互联网通信。 WebTable使用HBase的搜索和管理从网页中提取表。

使用案例#2:传感器数据

HASE是用于捕捉是从各种来源的增量收集的数据是有用的。这包括社交分析,时间序列,保持交互式仪表盘的最新潮流和计数器,以及管理审计日志系统。例子包括Bloomberg 交易终端和开放时间序列数据库(OpenTSDB)的商店,并提供访问收集服务器系统的健康指标。

用例#3:实时查询

Phoenix是Apache HBase的一个SQL查询引擎。它是作为一个JDBC驱动程序,并能使查询和使用SQL管理HBase的表。

用例#4:HBase的一个平台

应用程序可以在HBase的顶部使用它作为数据存储上运行。例子包括Phoenix ,OpenTSDB,KIJI,和Titan。应用程序也可以集成HBase的。例子包括Hive,Pig,Solr,Storm,Flume,Impala,Spark,Ganglia和Drill。

接下来的步骤

获取在HDInsight开始使用HBase的用Hadoop

提供HDInsight集群在Azure虚拟网络

与HBase的在HDInsight分析Twitter的感悟

使用Maven构建使用HBase的与HDInsight Java应用程序(Hadoop的)

C#HBase的SDK

另请参见

Apache的HBase

Bigtable的:分布式存储系统的结构化数据

本文翻译自Windows Azure官网:http://azure.microsoft.com/en-us/documentation/articles/hdinsight-hbase-overview/

转载请注明出处:http://blog.csdn.net/yangzhenping, 谢谢!

时间: 2024-08-02 06:43:07

HDInsight HBase的概述的相关文章

HDInsight HBase概观

HDInsight HBase概观 什么是HBase的? HBase它是基于HadoopApache开源NoSQL数据库.它提供了很多非结构化和半结构化数据一致性的随机存取能力的.它是仿照谷歌的BigTable.以家庭为中心的列式数据库. 数据被存储在一个行内的表和数据的行由列族分组. HBase的是在这个意义上,不管是列也不存储在当中的数据的类型,须要使用它们之前.定义一个无模式数据库.开放源码是首次公布由Mike Cafarella于2007年,线性扩展处理PB级数据的数千个节点.它能够依赖

关于HBase的概述

1.hbase的特点 ->数据存储量可以达到亿级别数据维持在秒级 ->按列存储的数据库 ->能够存储上百万列 ->hbase的底层存储依赖于HDFS ->如何扩展hbase,增加DataNode节点 ->添加一台机器以后,如何保证负载均衡 ->多版本version,int值 2.特殊概念 ->namespace:hbase中数据库的概念 ->列簇:对具有类似属性的列的组,建表时必须至少指明一个列簇 ->行键:对应的主键 ->version:

HBase详细概述

本文首先简单介绍了HBase,然后重点讲述了HBase的高并发和实时处理数据 .HBase数据模型.HBase物理存储.HBase系统架构,HBase调优.HBase Shell访问等. 不过在此之前,你可以先了解 Hadoop生态系统 ,若想运行HBase,则需要先搭建好Hadoop集群环境,可以参考此文搭建5个节点的hadoop集群环境(CDH5) . 好了,让我们来学习HBase吧! HBase简介 HBase的发展史 2006年底由PowerSet 的Chad Walters和Jim K

建立HBase的集群和HDInsight在Hadoop中使用Hive来查询它们

在本教程中,您将学习如何创建和查询HDInsight使用HiveHadoop的HBase的表.下列步骤描述:?如何使用提供在Azure门户的HBase的集群.?如何启用和使用RDP访问HBase的外壳,并使用HBase的外壳创建HBase的示例表,添加行,然后列出表中的行.?如何创建一个Hive表映射到一个现有的HBase的表,使用HiveQL查询数据在HBase的表.?如何使用Microsoft HBase的REST客户端库.NET创建一个新的HBase的表,列出您帐户中的HBase的表,以及

HDinsight Storm概述

HDinsight Storm概述 什么是Storm? Apache Storm是一个分布式,容错,开放源码的计算系统,让你来处理数据的实时.Storm解决方案还可以提供有保证的处理的数据,与重试未成功处理的第一次数据的能力. 什么是Azure HDInsight Storm? HDInsightStorm被提供作为一个管理的集群集成到Azure环境,在那里它可以被用来作为一个更大的Azure溶液的一部分.例如,Storm可能会使用来自服务,如ServiceBus队列或事件中心,和使用网站或云服

HBase简介

实验简介 我们本节课程将要讲述以下内容: HBase的概述及历史 HBase的数据模型 HBase的系统架构 一.HBase概述 HBase是一个开源的非关系型分布式数据库(NoSQL),它参考了谷歌的BigTable建模,实现的编程语言为 Java.它是Apache软件基金会的Hadoop项目的一部分,运行于HDFS文件系统之上,为 Hadoop 提供类似于BigTable 规模的服务,可以存储海量稀疏的数据,并具备一定的容错性.高可靠性及伸缩性.主要应用场景是实时随机读写超大规模的数据. H

Hbase原理

Hbase原理 概述 HBase是一个构建在HDFS上的分布式列存储系统:HBase是基于Google BigTable模型开发的,典型的key/value系统:HBase是Apache Hadoop生态系统中的重要一员,主要用于海量结构化数据存储:从逻辑上讲,HBase将数据按照表.行和列进行存储.与hadoop一样,Hbase目标主要依靠横向扩展,通过不断增加廉价的商用服务器,来增加计算和存储能力.Hbase表的特点大:一个表可以有数十亿行,上百万列:无模式:每行都有一个可排序的主键和任意多

微软Azure云平台Hbase 的使用

In this article What is HBase? Prerequisites Provision HBase clusters using Azure Management portal Mange HBase tables using HBase shell Use HiveQL to query HBase tables Use the Microsoft HBase REST client library to manage HBase tabels See also What

HBase中的备份和故障恢复方法

在这篇文章中,你将会对在HBase中可用的数据备份机制有一个高层次的简要了解,并且知道多种数据恢复/容灾机制.在阅读了这篇文章之后,你应该能对你的业务需要那种BDR策略有了自己的判断.你也应该明白各种机制各自的优缺点(适用于CDH 4.3.0/HBase 0.94.6及更高版本). 备份 HBase是一个基于LSM树(log-structured merge-tree)的分布式数据存储系统,它使用复杂的内部机制确保数据准确性.一致性.多版本等.因此,你如何获取数十个region server在H