一致性哈希(Consistent Hashing)

传统来讲，数据的存储位置是通过hash(object)%N来计算的，这样造成的问题是如果新的机器添加进来或是某台机器down掉了，通过这种算法计算出来的存储位置会和以前的不同，造成了大量数据的迁移，如果有新的机器添加进来也会造成同样的问题，所以容错性和扩展性都不好。一致性哈希算法的主要目的是尽量减少数据的迁移。

一致性哈希假设有一个闭合圆环空间，上面有2**31个位置，数据通过特定的hash算法被分布到哈希圆环上。机器也通过特定的hash算法(输入值为机器的IP或是机器唯一的别名)放到圆环上，然后沿顺时针方向把数据(object)存储到离它最近的机器上。假设某一机器down掉了，就把原先存储在这台机器上的数据沿顺时针方向存储到最近的其他机器上。假设有新的机器添加进来，如果有数据离它的距离比原先存放的位置更近，则存放的新的机器上，这样大大减少了数据迁移的次数。

一致性哈希通过引入虚拟node解决了hotspot问题。Hotspot的出现是因为数据的分配不均匀，比如大量数据存放在某一节点上，其他节点的利用率很低。那么如何生成虚拟节点呢？假如node1要生成属于node1的三个虚拟node, 具体实现如下：

hash(node1‘s ip#1) -> node1-1

hash(node1‘s ip#2) -> node1-2

hash(node1‘s ip#3) -> node1-3

这个思路非常像Network Mobile Systems课上的virtual layer 2，思路是通过abstraction来增加分散性。然后将虚拟节点映射到实际节点上来实现查询。

Reference:

http://blog.csdn.net/cywosp/article/details/23397179/

时间： 2024-12-21 20:49:03

一致性哈希(Consistent Hashing)的相关文章

Go语言实现一致性哈希(Consistent Hashing)算法

一致性哈希可用于解决服务器均衡问题. 用Golang简单实现了下,并加入了权重.可采用合适的权重配合算法使用. package main //一致性哈希(Consistent Hashing) //author: Xiong Chuan Liang //date: 2015-2-20 import ( "fmt" "hash/crc32" "sort" "strconv" "sync" ) const DE

深入一致性哈希(Consistent Hashing)算法原理，并附100行代码实现

本文为实现分布式任务调度系统中用到的一些关键技术点分享——Consistent Hashing算法原理和Java实现,以及效果测试. 背景介绍一致性Hashing在分布式系统中经常会被用到, 用于尽可能地降低节点变动带来的数据迁移开销.Consistent Hashing算法在1997年就在论文Consistenthashing and random trees中被提出. 先来简单理解下Hash是解决什么问题.假设一个分布式任务调度系统,执行任务的节点有n台机器,现有m个job在这n台机器上运

一致性哈希(consistent hashing)算法

文章同步发表在博主的网站朗度云,传输门:http://www.wolfbe.com/detail/201608/341.html 1.背景我们都知道memcached服务器是不提供分布式功能的,memcached的分布式完全是由客户端来实现的.在部署memcached服务器集群时,我们需要把缓存请求尽可能分散到不同的缓存服务器中,这样可以使得所有的缓存空间都得到利用,而且可以降低单独一台缓存服务器的压力. 最简单的一种实现是,缓存请求时通过计算key的哈希值,取模后映射到不同的memc

用于KV集群的一致性哈希Consistent Hashing机制

KV集群的请求分发假定N为后台服务节点数,当前台携带关键字key发起请求时,我们通常将key进行hash后采用模运算 hash(key)%N 来将请求分发到不同的节点上, 后台节点的增删会引起几乎所有key的重新映射, 这样会造成大量的数据迁移,如果数据量大的话会导致服务不可用. 一致性哈希机制我倾向于称之为一致性哈希机制而不是算法, 因为这其实和算法没太大关系. 设计这种机制的目的是当节点增减时尽量减小重新映射的key的数量, 尽量将key还映射到原来的节点上. 而对于一致性哈希机制, 如

一致性hash算法 – consistent hashing

consistent hashing 算法早在 1997 年就在论文 Consistent hashing and random trees 中被提出,目前在cache 系统中应用越来越广泛: 1 基本场景比如你有 N 个 cache 服务器(后面简称 cache ),那么如何将一个对象 object 映射到 N 个 cache 上呢,你很可能会采用类似下面的通用方法计算 object 的 hash 值,然后均匀的映射到到 N 个 cache :澳门威尼斯人赌场 hash(object)%N

2016 -Nginx的负载均衡 - 一致性哈希 (Consistent Hash)

Nginx版本:1.9.1 算法介绍当后端是缓存服务器时,经常使用一致性哈希算法来进行负载均衡. 使用一致性哈希的好处在于,增减集群的缓存服务器时,只有少量的缓存会失效,回源量较小. 在nginx+ats / haproxy+squid等CDN架构中,nginx/haproxy所使用的负载均衡算法便是一致性哈希. 我们举个例子来说明一致性哈希的好处. 假设后端集群包含三台缓存服务器,A.B.C. 请求r1.r2落在A上. 请求r3.r4落在B上. 请求r5.r6落在C上. 使用一致性哈希时,当

一致性hash算法 - consistent hashing

1.背景我们都知道memcached服务器是不提供分布式功能的,memcached的分布式完全是由客户端来实现的.在部署memcached服务器集群时,我们需要把缓存请求尽可能分散到不同的缓存服务器中,这样可以使得所有的缓存空间都得到利用,而且可以降低单独一台缓存服务器的压力. 最简单的一种实现是,缓存请求时通过计算key的哈希值,取模后映射到不同的memcahed服务器.这种简单的实现在不考虑集群机器动态变化的情况下也是比较有效的一种方案,但是,在分布式集群系统中,简单取模的哈希算法

_00013 一致性哈希算法 Consistent Hashing 探讨以及相应的新问题出现解决

一.业务场景假如我们现在有12台Redis服务器(其它的什么东西也行),有很多User(用户)的数据数据从前端过来,然后往12台redis服务器上存储,在存储中就会出现一个问题,12台服务器,有可能其中几台Redis服务器上(简称集群A)存了很多的数据,然后另外几台Redis服务器(简称集群B)上存的数据很少,这样的话那 A 上的读写压力就会很大(当然,这个要看你的数据量的大小了,如果你数据量很小的话,基本无压力了,但是数据量很大,那就 ...),对于这样的问题,我们通常的解决办法是什么呢 ?

_00013 一致性哈希算法 Consistent Hashing 新的讨论，并出现相应的解决

笔者博文:妳那伊抹微笑博客地址:http://blog.csdn.net/u012185296 个性签名:世界上最遥远的距离不是天涯,也不是海角,而是我站在妳的面前.妳却感觉不到我的存在技术方向:Flume+Kafka+Storm+Redis/Hbase+Hadoop+Hive+Mahout+Spark ... 云计算技术转载声明:能够转载, 但必须以超链接形式标明文章原始出处和作者信息及版权声明,谢谢合作. qq交流群:214293307 idkey=bf80524ac3630cb09

猜你喜欢

MVVM大比拼之vue.js源码精析

VUE 源码分析简介 Vue 是 MVVM 框架中的新贵,如果我没记错的话作者应该毕业不久,现在在google.vue 如作者自己所说,在api设计上受到了很多来自knockout.angularj ...

Java基础——线程总结

Java基础--线程总结一.线程是什么? 线程:一个程序里不同的执行路径. 二.如何创建线程? 两种方法创建线程: 第一种 (1)定义具体功能类实现Runnable接口,可以多次调用而实现数据共享 ...

vs2012远程调试

不知道大家有没有遇到过这种情况,刚开发完的程序,明明在本机能够好好的运行,可是部署到服务器过分发给用户时,总是出现莫名其妙的错误. 一时半会又看不出问题来,怎么办呢?难道只能在服务器或是客户电脑上装一 ...

C语言--指针(一)

#import <Foundation/Foundation.h> //交换函数 void swap(int x, int y) { printf("x=%d,y=%d" ...

南京理工大学第八届校赛 J-water1

water1 Time Limit: 1000MS Memory Limit: 65536KB Description 听说全球气候变暖,冰川融化,海水淹大地.着实好奇要融化多少冰川会淹没我的宿舍,哦 ...

基于Nginx简单实现动静分离

1.首先安装Nginx 2.在Nginx.conf文件中添加如下配置: server{ listen 80; server_name www.lf.com; location ~ (.jpg|.png ...

hdu---1950---Bridging signals

题目链接: http://acm.split.hdu.edu.cn/showproblem.php?pid=1950 Description 'Oh no, they've done it again ...

es6-Iterator与for...of

Iterator(遍历器)的概念 JavaScript原有的表示"集合"的数据结构,主要是数组(Array)和对象(Object),ES6又添加了Map和Set.这样就有了四种数据 ...

js数组常用操作方法小结(增加,删除,合并,分割等)

本文实例总结了js数组常用操作方法.分享给大家供大家参考,具体如下: var arr = [1, 2, 3, 4, 5]; //删除并返回数组中第一个元素 var theFirst = arr.shi ...

描述检查一个如下的6 x 6的跳棋棋盘,有六个棋子被放置在棋盘上,使得每行.每列只有一个,每条对角线(包括两条主对角线的所有平行线)上至多有一个棋子. 列号 1 2 3 4 5 6 -------- ...

项目群管理知多少

如今的组织处于一个不得不变革的状态.经常会有很多动态因素或者是矛盾因素驱动的变革,其中就包含技术创新.工作实践(例如,外包和合作伙伴).兼并,国家的各种方针政策的推行也位列其中.不论是什么样的组织,无 ...

javaWeb之maven多数据库环境的配置信息

在使用maven构建的web项目里,不管采用的是什么orm框架,数据库写死了必然不是最灵活的方式.所以通过maven 的buid方式可以动态的分配数据库信息比如在jdbc.properties中,可 ...

使用--echarts

为ECharts准备一个具备大小(宽高)的Dom(当然可以是动态生成的) //from echarts example <body> <div id="main" ...

Guava学习笔记：　Files

Guava Files中的文件操作转载:http://outofmemory.cn/java/guava/IO/Files-operation 介绍Guava IO包提供的方便操作文件的方法,包括: ...

SQL Server 日期和时间函数

http://www.cnblogs.com/adandelion/archive/2006/11/08/554312.html 1.常用日期方法(下面的GetDate() = '2006-11-08 ...

verilog 不可综合语句

最近在温习Verilog,让可综合不可综合搞得头大.在网上发现了这篇文章,整理的非常整齐. 转自http://bbs.ednchina.com/BLOG_ARTICLE_1770084.HTM 基础知 ...

蛇梯棋（转载）

1 //题目的大概意思是又N*N的棋盘,编号从1 到 N*N 棋盘中分布着蛇和梯子玩家在位置1处, 2 //然后掷骰子,如果点数在梯子尾则顺着梯子到达梯子头,若掷到蛇头,则滑到蛇尾 3 //问最快到达 ...

C++代码片段01 - 字符串中查找是否有某个字符

<span style="font-size:18px;">if( third_name.find('*')!=string::npos || third_name.f ...

Spring要点总结

IOC :Inverse of control 控制反转 DI :Dependency Injection 依赖注入 --- Bean的生命范围scope属性: 1)singleton 单例 2)pr ...

angularJS中-$route路由-$http(ajax)的使用

后台请求使用的是nodeJS驱动(后面帖代码),很简单的RESTFUL, 页面使用的是bottstarp3.0(懒人神器); 第一个例子: 在本地架设NODEJS, angular的所有请求都是请求本 ...

专题

随机推荐

© 2025 憋错料 | info#biecuoliao.com | 10 q. 0.023 s.