HBASE的读写以及client API

一：读写思想

1.系统表

　　hbase：namespace

　　　　存储hbase中所有的namespace的信息

　　hbase：meta　　　

　　　　rowkey:hbase中所有表的region的名称
　　　　column：regioninfo：region的名称，region的范围
　　　　server：该region在哪台regionserver上

2.读写流程

　　tbname,rowkey -> region -> regionserver -> store -> storefile

　　但是这些都是加载过meta表之后，然后meta表如何寻找？

3.读的流程　　

　　-》根据表名和rowkey找到对应的region
　　-》zookeeper中存储了meta表的region信息
　　-》从meta表中获取相应的region的信息
　　-》找到对应的regionserver
　　-》查找对应的region
　　-》读memstore
　　-》storefile

4.写的流程　　

　　-》根据表名和rowkey找到对应的region
　　-》zookeeper中存储了meta表的region信息
　　-》从meta表中获取相应的region的信息
　　-》找到对应的regionserver
　　-》正常情况
　　-》WAL（write ahead log预写日志），一个regionserver维护一个hlog
　　-》memstore (达到一定大小，flush到磁盘)
　　-》当多个storefile达到一定大小以后，会进行compact，合并成一个storefile
　　-》当单个storefile达到一定大小以后，会进行split操作，等分割region

5.注意点

　　关于版本的合并和删除是在compact阶段完成的。hbase只负责数据的增加存储
　　hmaster短暂的不参与实际的读写

时间： 2024-10-06 22:44:03

HBASE的读写以及client API的相关文章

HBase Client API使用入门（二）---查询及过滤器

相关知识创建表插入数据删除等见:http://www.cnblogs.com/wishyouhappy/p/3735077.html HBase API简介见:http://www.cnblogs.com/wishyouhappy/p/3753347.html 按行.列簇等查询 package wish.hbase; import java.io.IOException; import java.util.ArrayList; import java.util.List; import org

HBase 二次开发 java api和demo

1. 试用thrift python/java以及hbase client api,结论如下: 1.1 thrift的安装和发布繁琐,可能会遇到未知的错误,且hbase.thrift的版本在变化中.优点代码简单,需要打包的内容少. 1.2 hbase client api,需要的jar很多,发布版的容量也很大,打包后近百兆.优点是,明确,无歧义. 2. 推荐用hbase client api的方式搞定. 3. 以下均为技术细节. 4. 有一台机器/一个集群,在运行hadoop,也运行了基于这个h

Hbase新旧版的API

1 package com.felix.hbaseapi_test; 2 3 /* 这是旧版的 API操作 */ 16 public class hbaseapifelix { 17 18 public static final String TABLE_NAME = "testapi"; 19 public static final String COLUMNFAMILY_NAME = "cf"; 20 public static final String ROW

HBase 数据读写流程

HBase 数据读写流程 2016-10-18 杜亦舒读数据 HBase的表是按行拆分为一个个 region 块儿,这些块儿被放置在各个 regionserver 中假设现在想在用户表中获取 row key 为 row0001 的用户信息要想取得这条数据,就需要先找到含有此条记录的 region HBase 是如何定位到具体 regionserver 中的具体 region 的呢? HBase 中有一个内置的 hbase:meta 表,其中记录了所有表的所有 region 的详细信息例如

Memcached Java Client API详解

针对Memcached官方网站提供的java_memcached-release_2.0.1版本进行阅读分析,Memcached Java客户端lib库主要提供的调用类是SockIOPool和MemCachedClient?,关键类及方法整理说明如下. SockIOPool 这个类用来创建管理客户端和服务器通讯连接池,客户端主要的工作包括数据通讯.服务器定位.hash码生成等都是由这个类完成的. public static SockIOPool getInstance() 获得连接池的单态方法.

spark读写压缩文件API使用详解

最近研究了下Spark如何读写压缩格式的文件,主要有如下三种方式,这里以lzo方式压缩为例 /*******************old hadoop api*************************/ val confHadoop = new JobConf confHadoop.set("mapred.output.compress", "true") confHadoop.set("mapred.output

ecshop /api/client/api.php、/api/client/includes/lib_api.php SQL Injection Vul

catalog 1. 漏洞描述 2. 漏洞触发条件 3. 漏洞影响范围 4. 漏洞代码分析 5. 防御方法 6. 攻防思考 1. 漏洞描述 ECShop存在一个盲注漏洞,问题存在于/api/client/api.php文件中,提交特制的恶意POST请求可进行SQL注入攻击,可获得敏感信息或操作数据库 http://sebug.net/vuldb/ssvid-21007 2. 漏洞触发条件 1. /api/client/api.php存在未过滤漏洞 2. 服务器magic_quote_gpc =

ElasticSearch--------------------->Elasticsearch Clients--------------------->Java REST Client API

Elasticsearch-->Java REST Client API 概述: elasticsearch提供了REST WEB API,所以开发者可以在自己的restful web中调用elasticsearch 关于Java REST Client API的详细叙述,参见官方documentation:Java REST Client API 可以直接使用curl来调用elasticsearch: 基本语法格式:RESTful API with JSON over HTTP 使用示例: 例

jupyter Client API

Jupyter Client Api : Jupyter Kernel :http://jupyter-client.readthedocs.io/en/latest/kernels.html Jupyter Client API: http://jupyter-client.readthedocs.io/en/latest/api/kernelspec.html

猜你喜欢

linux下挂载samba时报错，wrong fs type，bad option，bad superblock

环境:172.24.21.22是samba服务端使用mount命令直接挂载,如下居然报错,那我们使用-t 参数,加上cifs 居然还是报错仔细查看上面的报错,小括号里面的,need a /sbi ...

[hdu1394]Minimum Inversion Number(树状数组)

Minimum Inversion Number Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/32768 K (Java ...

cocos2d 动作回调函数

// on "init" you need to initialize your instance bool HelloWorld::init() { ////////////// ...

内存使用情况

第一行所列出的是当前的内存的使用情况第二行则是swap交换空间的使用情况. 系统中used并不是所有的被使用的内存.因为当Linux将一根文件载入到RAM中,当程序用完这个文件的时候,不需要将它从R ...

.Net常用技巧_VS2005[C#] 操作 Excel 全攻略（转）

using System; using System.Collections.Generic; using System.ComponentModel; using System.Data; usin ...

selenium3+firefox 报错

The path to the driver executable must be set by the webdriver.gecko.driver system property 报这个错,是因为 ...

MySQL5.6的Linux安装之二进制安装（一）

最近在写一个MySQL的shell安装脚本说明一点着里面的所有路径都是绝对路径下面来总结一下安装遇到的一些问题,以及安装的过程这个是自带的安装过程 shell> groupadd mys ...

jQuery EasyUI 1.4更新记录

问题: menu:修复当删除一个menu项时.menu高度不准确. datagrid:修复当datagrid宽度太小时,fitColumns方法不能使用. 改进: 1.为easyui全部组件新增了自适 ...

一. 线性表的几种形式: 1.线性表是最常用且最简单的一种数据结构. 线性表中元素的个数n定义为线程表的长度,n= 0时称为空表. 2. 线性表的顺序表示指的是用一组地址连续的存储单元依次存储线性表的 ...

JavaEE Tutorials (18) - Java EE平台安全介绍

18.1Java EE安全概述278 18.1.1简单的应用安全演示279 18.1.2安全机制特性281 18.1.3应用安全特点28118.2安全机制282 18.2.1Java SE安全机制28 ...

【bzoj2096】[Poi2010]Pilots 双指针法+STL-set

题目描述 Tz又耍畸形了!!他要当飞行员,他拿到了一个飞行员测试难度序列,他设定了一个难度差的最大值,在序列中他想找到一个最长的子串,任意两个难度差不会超过他设定的最大值.耍畸形一个人是不行的,于是他 ...

day36-hibernate检索和优化 01-上次课内容回顾

clear():直接清空一级缓存的所有对象.evict(Object obj):清空一个对象.flush():控制你的刷出的时机.refresh(Object obj);将你的数据查出来把一级缓存覆盖 ...

Javascript 优化

Javascript 优化作者:@gzdaijie本文为作者原创,转载请注明出处:http://www.cnblogs.com/gzdaijie/p/5324489.html 目录 1.全局变量污染 ...

NYOJ 116 士兵杀敌二

士兵杀敌(二) 时间限制:1000 ms | 内存限制:65535 KB 难度:5 描述南将军手下有N个士兵,分别编号1到N,这些士兵的杀敌数都是已知的. 小工是南将军手下的军师,南将军经常想知 ...

c++中的const参数，const变量，const指针，const对象，以及const成员函数

const 是constant 的缩写,“恒定不变”的意思.被const 修饰的东西都受到强制保护,可以预防意外的变动,能提高程序的健壮性.所以很多C++程序设计书籍建议:“Use const whe ...

Web API 1之EntityFramework【CRUD】（三）

前言之前我们系统学习了EntityFramework,个人觉得有些东西不能学了就算完了,必须要学以致用,在Web API上也少不了增(C).删(D).改(U).查(R).鉴于此,我们通过EF来实现W ...

运行App

如果你学习了前面的教程,那么你已经有一个包含了默认的“Hello World”源文件的项目了,你可以零修改的立即运行该应用程序. 你如何运行你的应用取决于两件事:你是否有一个真正的Android系统的 ...

laraven安装记录

版本4.2.11 下载地址:https://codeload.github.com/laravel/laravel/zip/v4.2.11 步骤: 1.解压到目录 2.下载composer,并放到/u ...

sqlserver数据库出现可疑错误修复方法

一.主数据库出现可疑修复方法: 第一种方法: 当数据库发生这种操作故障时,可以按如下操作步骤可处理此要领,打开数据库里的Sql查询编辑器窗口,运行以下的命令: ?修改数据库为紧急模式 ALTER DA ...

初始化_03

类中域为基本类型可以被自动初始化为0,对象引用会被初始化为null. 初始化对象引用的方法 { 1.在定义对象的地方. 2.在类的构造器中 3.在正要使用对象之前(惰性初始化) 4.实例初始化 } c ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.018 s.