hbase中的缓存的计算与使用

hbase中的缓存分了两层：memstore和blockcache。

其中memstore供写使用，写请求会先写入memstore，regionserver会给每个region提供一个memstore，当 memstore满64MB以后，会启动flush刷新到磁盘。当memstore的总大小超过限制时（heapsize * hbase.regionserver.global.memstore.upperLimit * 0.9），会强行启动flush进程，从最大的memstore开始flush直到低于限制。

blockcache主要提供给读使用。读请求先到memstore中查数据，查不到就到blockcache中查，再查不到就会到磁盘上读，并把读的结果放入blockcache。由于blockcache是一个LRU,因此blockcache达到上限(heapsize * hfile.block.cache.size * 0.85)后，会启动淘汰机制，淘汰掉最老的一批数据。

一个regionserver上有一个blockcache和N个memstore，它们的大小之和不能大于等于heapsize * 0.8，否则hbase不能启动。默认blockcache为0.2，而memstore为0.4。对于注重读响应时间的系统，应该将 blockcache设大些，比如设置blockcache=0.4，memstore=0.39。这会加大缓存命中率。

时间： 2024-10-10 05:41:18

hbase中的缓存的计算与使用的相关文章

hbase中的位图索引--布隆过滤器

在hbase中,读业务是非常频繁的.很多操作都是客户端根据meta表定位到具体的regionserver然后再查询region中的具体的数据. 但是现在问题来了,一个region由一个memstore以及多个filestore组成,memstore类似缓存在服务器内存中,可以提高插入的效率,当memstore达到一定大小(由hbase.hregion.memstore.flush.size设置)或者说用户手动flush之后,就会固化存储在hdfs之类的磁盘系统上.也就是说一个region可以对应

淘宝在hbase中的应用和优化

本文来自于NoSQLFan联合作者@koven2049,他在淘宝从事Hadoop及HBase相关的应用和优化.对Hadoop.HBase都有深入的了解,本文就是其在工作中对HBase的应用优化小结,分享给大家. 目录 [ - ] 前言原因应用情况部署.运维和监控测试与发布改进和优化将来计划前言 hbase是从 hadoop中分离出来的apache顶级开源项目.由于它很好地用java实现了google的bigtable系统大部分特性,因此在数据量猛增的今天非常受到欢迎.对于淘宝而言

Hbase学习（八）Hbase中的Coprocessor

1.起因(Why HBase Coprocessor) HBase作为列族数据库最经常被人诟病的特性包括:无法轻易建立"二级索引",难以执行求和.计数.排序等操作.比如,在旧版本的(<0.92)Hbase中,统计数据表的总行数,需要使用Counter方法,执行一次MapReduce Job才能得到.虽然HBase在数据存储层中集成了MapReduce,能够有效用于数据表的分布式计算.然而在很多情况下,做一些简单的相加或者聚合计算的时候,如果直接将计算过程放置在server端,能

在网站中数据缓存的重要性

通过计算斐波那契数列明白缓存在网站开发中的重要性 1 .首先测试一下没有使用数据缓存来计算斐波那契数列. var count = 0; function fib(n) { count++; if(n === 0 || n === 1) { return 1; } return fib(n - 1) + fib(n - 2); } fib(40); console.log(count);//count是函数fib运算次数,当fib(40)时候运行次数高达:331160281次,感兴趣的可以检测一下

java中的缓存技术该如何实现

1缓存为什么要存在?2缓存可以存在于什么地方?3缓存有哪些属性?4缓存介质? 搞清楚这4个问题,那么我们就可以随意的通过应用的场景来判断使用何种缓存了. 1. 缓存为什么要存在?一般情况下,一个网站,或者一个应用,它的一般形式是,浏览器请求应用服务器,应用服务器做一堆计算后再请求数据库,数据库收到请求后再作一堆计算后把数据返回给应用服务器,应用服务器再作一堆计算后把数据返回给浏览器.这个是一个标准流程.但是随着互连网的普及,上网的人越来越多,网上的信息量也越来越多,在这两个越来越多的情况下

MapReduce 读取和操作HBase中的数据

MapReduce 中如何处理HBase中的数据?如何读取HBase数据给Map?如何将结果存储到HBase中? 2012-07-05 13:40 89人阅读评论(0) 收藏举报 MapReduce 中如何处理HBase中的数据?如何读取HBase数据给Map?如何将结果存储到HBase中? Mapper类:包括一个内部类(Context)和四个方法(setup,map,cleanup,run): setup,cleanup用于管理Mapper生命周期中的资源.setup

HBase中的压缩算法比较 GZIP、LZO、Zippy、Snappy [转]

网址: http://www.cnblogs.com/panfeng412/archive/2012/12/24/applications-scenario-summary-of-compression-algorithms.html GZIP.LZO.Zippy/Snappy是常用的几种压缩算法,各自有其特点,因此适用的应用场景也不尽相同.这里结合相关工程实践的情况,做一次小结. 压缩算法的比较以下是Google几年前发布的一组测试数据(数据有些老了,有人近期做过测试的话希望能共享出来):

【安卓中的缓存策略系列】安卓缓存策略之磁盘缓存DiskLruCache

安卓中的缓存包括两种情况即内存缓存与磁盘缓存,其中内存缓存主要是使用LruCache这个类,其中内存缓存我在[安卓中的缓存策略系列]安卓缓存策略之内存缓存LruCache中已经进行过详细讲解,如看官还没看过此博客,建议看官先去看一下. 我们知道LruCache可以让我们快速的从内存中获取用户最近使用过的Bitmap,但是我们无法保证最近访问过的Bitmap都能够保存在缓存中,像类似GridView等需要大量数据填充的控件很容易就会用完整个内存缓存.另外,我们的应用可能会被类似打电话等行为而暂停导

为什么不建议在 HBase 中使用过多的列族

我们知道,一张 HBase 表包含一个或多个列族.HBase 的官方文档中关于 HBase 表的列族的个数有两处描述: A typical schema has between 1 and 3 column families per table. HBase tables should not be designed to mimic RDBMS tables. 以及 HBase currently does not do well with anything above two or thre

猜你喜欢

删除rsyslog中的#011

操作步骤: 打开VPN 谷歌浏览器输入 rsyslog #011 查看关键字的网络: 摘自:http://wiki.rsyslog.com/index.php/Snare_and_rsyslog 摘自 ...

利用COM组件实现对WORD书签处写入值

using System; using System.Collections.Generic; using System.Text; using Microsoft.Office.Interop.Wo ...

eclipse编写scala应用运行在spark集群上

代码 package spark_1 import org.apache.spark.SparkConf import org.apache.spark.SparkContext class Work ...

Beta版总结会议

1.会议过程及问题我们首先梳理了一下这两次冲刺过程,仔细考虑过程中的每个细节,将过程与最后的成果一并进行分析,发现此过程中的确存在着几个问题. ①在我们的两次冲刺过程中,时间以及工作量的安排存在一定 ...

从刚买的虾里面剥出来这个！

经过专家鉴定后表示,这位网友所购买到为注胶虾. 1)食用明胶----在食品工业中是一种重要的配料和添加剂,常作为胶凝剂.稳定剂.乳化剂.增稠剂和澄清而一些不法商贩注射工业明胶,工业明胶对身体有巨大的 ...

Linux_arm驱动之按键模拟脉冲实现定时器的精确计时

http://wenku.baidu.com/link?url=-9_IHk-7BFRSAxPAeutaQ8Ifhs0Rs9Qg3yAG9LxsqYqRauQRBwjVJ_xnmQ6R-CKbwVDS ...

电商初级技术方案探讨

一. 电商技术栈主流: nginx + lua ??? 待验证 from http://www.infoq.com/cn/articles/e-commerce-web-tech-sta ...

jQuery 变量数字相加

js中,一个变量和一个数字相加,得到的是相连之后的结果. 比如,var a = "1" + 2,结果为12,比如我在 input 框中取出值,并使其加一, var num = $( ...

shell 中特殊符号

在学习linux的过程中,也许你已经接触过某个特殊符号,例如"*",它是一个通配符号,代表零个或多个字符或数字.下面阿铭就说一说常用到的特殊字符. * 代表零个或多个任意字符. [ ...

安装完Hadoop之后，命令行输入hadoop或hdfs却找不到命令的解决方法

大多数原因是没有配置环境变量解决方法 1. cd /etc/profile 2. 把这三条加到proflie文件的最后 export JAVA_HOME=XXXX(在安装了jdk的前提下,echo ...

java学习之面向对象（3）

下面来谈谈java编程中的一些语法: 1.什么是对象数组? 对象数组就是数组里的每个元素都是类的对象,赋值时先定义对象,然后将对象直接赋值给数组. 对象数组的声明: 类名[] 对象数组名称 = n ...

[傅里叶变换及其应用学习笔记] 二十五. 线性系统，传递函数，特征值

矩阵卷积,离散有限维线性时不变系统与上一节课连续无限维线性时不变系统有相同的描述:当且仅当线性算符是用卷积表达的,该系统才是线性时不变系统(LTI system). $\underline{w} = ...

使用ObjectAnimator开发打开、关闭书本动画

动画效果动画效果-分享链接 (想做成gif图的,尝试各种工具无果) ObjectAnimator简介及实现思路 ObjectAnimator是从api level 11 (Android3.0x)增 ...

c#与oracle数据库连接池

c#与oracle数据库连接池在做一个项目,中间要使用webservice和oracle数据库.我在服务端做了用户身份认证,也就是使用session传递用户的登陆信息.在测试时,当用户少的时候,没有 ...

【web开发学习笔记】Structs2 Action学习笔记（两）

action学习笔记2-大约action method讨论 Action运行的时候并不一定要运行execute方法,能够在配置文件里配置Action的时候用method=来指定运行哪个方法也能够在u ...

在 Azure 虚拟机上快速搭建 MongoDB 集群

MongoDB 是目前在 NoSQL 市场上非常受欢迎的一个数据库,本文介绍如何使用 Azure PowerShell 和 Azure CLI 在 Azure 虚拟机上搭建单节点 MongoDB(测试 ...

HDU1021 Fibonacci Again

题意: F(0)= 7, F(1) = 11 F(n) = ( F(n-1) + F(n-2) ) (n>=2). 输入n,若F(n)(mod3)为0则输出yes,否则输出no 题解: 如果直接 ...

c#无边窗体实现移动的两种方式

转载:http://blog.csdn.net/dxsh126/article/details/2940226 首先,要用到一个WimdowsAPI函数,因此必须引入 using System.Run ...

传多个id 存入一个容器里，让另一个页面接受并显示数据

要传页面的id: <ul class="contrast-ul">  </u ...

ISP模块之RAW DATA去噪（一）

ISP(Image Signal Processor),图像信号处理器,主要用来对前端图像传感器输出信号处理的单元,主要用于手机,监控摄像头等设备上. RAW DATA,可以理解为:RAW图像就是CM ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.019 s.