memcached分布式布置方案

引入:当一台memcached服务器不能满足我们的要求时,需要布置多台服务器,那么问题来了,怎么确定一个数据该放在哪台服务器上呢?

一般有两种方案,一个是普通hash分布,另一个是一致性hash分布。

1. 普通hash分布

函数如下:

<span style="font-family:Microsoft YaHei;font-size:18px;">functionmHash($key){
      $md5 = substr(md5($key),0,8);
      $seed = 31;
      $hash = 0;
      for($i = 0;$i < 8; $i ++){
                    $hash = $hash *$seed +ord($md5{$i});
                    $i++;
      }
      return $hash & 0x7FFFFFFF;
}</span>

首先通过md5把key处理成一个32位字符串,取其前8字符。在经过hash算法处理成一个整数并返回,然后映射到另一个memcached服务器。

假设配置两台memcached服务器,可以使用下面代码映射:

<span style="font-family:Microsoft YaHei;font-size:18px;"><?
      $servers = array(
             array("host" =>"192.168.1.12","port" => 6397),
             array("host" =>"192.168.1.20","port" => 6397),
      );
      $key = "TheKey";
      $value = "TheValue";
      $sc = servers[mHash($key)%2];
      $memcached =new memcached($sc);
      $memcached -> set($key,$value);</span>

通过Hash函数把key转化成整数后,利用这个整数与memcached服务器数量取模,这样就得到的是其中的一台服务器的配置,利用这个配置链接memcached服务器,这样就完成了分布式布置,取数据和保存数据的方法一样,把set命令改成get命令就可以了。

2. 一致性Hash分布

在服务器数量不发生改变时,普通的Hash分布可以很好地运作。当服务器的数量发生改变时,问题就出来了,试想,增加一台服务器时,同一个key经过Hash之后,与服务器取模的结果跟没增加服务器之前的结果会不一样,这就导致之前保存的数据丢失。为了把丢失的数据减少到最少,可以采用一致性hash算法。

一致性hash算法分为6个步骤:

步骤1:

将一个32位整数0~2^32-1想象成一个环,将0作为圆环的头,2^32-1作为圆环的尾,把它连接起来。

步骤2:

通过Hash函数把key处理成整数:

<span style="font-family:Microsoft YaHei;">        $key1 = mHash(“key1”);
        $key2= mHash(“key2”);
        $key3 = mHash(“key3”);
        $key4= mHash(“key4”);</span>

把key处理成整数之后,就可以在环中找到一个位置与之对应。

步骤3:

把memcached群映射到环上,使用Hash函数处理服务器所使用的IP地址。

例如有3台服务器,使用下面的方法映射到环上。

<span style="font-family:Microsoft YaHei;">        $server1 = mHash(“192.168.1.1”);
        $server2 = mHash(“192.168.1.2”);
        $server3 = mHash(“192.168.1.3”);</span>

把服务器映射到环上,如图所示:

经过上面的几个步骤,我们把数据的key和服务器都映射到同一个环上,下面考虑如何把数据映射到服务器上。

步骤4:把数据映射 到服务器上

沿着环顺时针方向的key出发,知道遇到下一个服务器为止,把key对应的数据保存到这个服务器上。根据上面的方法,key4和key3保存到server2上,key2保存到server1上,key1保存到server3上。

步骤5:移除服务器

考虑一下,如果server2服务器崩溃了,那么受最大影响的仅是沿着server2逆时针出发直到下一个服务器之间的数据,也就是映射到server2上的那些数据。然后依照规则,将server2服务器上的数据移植下一个服务器上即可。

步骤6:添加服务器。

再考虑一下,如果要添加一个服务器server4,用之前的方法把它映射到key3和key4之间,这时受到的影响是沿着server4逆时针出发直至遇到下一个服务器之间的数据,把这些数据重新映射到server4上即可。

版权声明:本文为博主原创文章,未经博主允许不得转载。

时间: 2024-08-29 23:29:31

memcached分布式布置方案的相关文章

Memcached常规应用与分布式部署方案

1.Memcached常规应用 $mc = new Memcache(); $mc->conncet('127.0.0.1', 11211); $sql = sprintf("SELECT * FROM users WHERE uid = %d", $_GET['uid']); $key = md5($sql); //检测结果是否已经被缓存 if( ! $data = $mc->get($key)){ //没有缓存则直接从数据库读取 mysql_conncet('local

Memcached 和 Redis 分布式锁方案

分布式缓存,能解决单台服务器内存不能无限扩张的瓶颈.在分布式缓存的应用中,会遇到多个客户端同时争用的问题.这个时候,需要用到分布式锁,得到锁的客户端才有操作权限. Memcached 和 Redis 是常用的分布式缓存构建方案,下面列举下基于Memcached 和 Redis 分布式锁的实现方法. Memcached 分布式锁 Memcached 可以使用 add 命令,该命令只有KEY不存在时,才进行添加,或者不会处理.Memcached 所有命令都是原子性的,并发下add 同一个KEY ,只

java 分布式锁方案

第一步,自身的业务场景: 在我日常做的项目中,目前涉及了以下这些业务场景: 场景一: 比如分配任务场景.在这个场景中,由于是公司的业务后台系统,主要是用于审核人员的审核工作,并发量并不是很高,而且任务的分配规则设计成了通过审核人员每次主动的请求拉取,然后服务端从任务池中随机的选取任务进行分配.这个场景看到这里你会觉得比较单一,但是实际的分配过程中,由于涉及到了按用户聚类的问题,所以要比我描述的复杂,但是这里为了说明问题,大家可以把问题简单化理解.那么在使用过程中,主要是为了避免同一个任务同时被两

可扩容分布式session方案

分布式session有以下几种方案: 1. 基于nfs(net filesystem)的session共享 将共享服务器目录mount各服务器的本地session目录,session读写受共享服务器io限制,不能满足高并发. 2. 基于关系数据库的session共享 这种方案普遍使用.使用关系数据库存储session数据,对于mysql数据库,建议使用heap引擎. 这种方案性能取决于数据库的性能,在高并发下容易造成表锁(虽然可以采用行锁的存储引擎,性能会下降),并且需要自己实现session过

Discuz!NT中集成Memcached分布式缓存

大约在两年前我写过一篇关于Discuz!NT缓存架构的文章,在那篇文章的结尾介绍了在IIS中如果开启多个应用程序池会造成多个缓存实例之间数据同步的问题.虽然给出了一个解决方案,但无形中却把压力转移到了磁盘I/O上(多个进程并发访问cache.config文件).其实从那时起我就开始关注有什么更好的方案,当然今天本文中所说的Memcached,以及Velocity等这类的分布式缓存方案之前都考虑过,但一直未能决定该使用那个.起码Velocity要在.net 4.0之后才会提供,虽然是原生态,但有些

Discuz!NT中集成Memcached分布式缓存(转)

大约在两年前我写过一篇关于Discuz!NT缓存架构的文章,在那篇文章的结尾介绍了在IIS中如果开启多个应用程序池会造成多个缓存实例之间数据同步的问题.虽然给出了一个解决方案,但无形中却把压力转移到了磁盘I/O上(多个进程并发访问cache.config文件).其实从那时起我就开始关注有什么更好的方案,当然今天本文中所说的Memcached,以及Velocity等这类的分布式缓存方案之前都考虑过,但一直未能决定该使用那个.起码Velocity要在.net 4.0之后才会提供,虽然是原生态,但有些

memcached分布式实现原理

摘要 在高并发环境下,大量的读.写请求涌向数据库,此时磁盘IO将成为瓶颈,从而导致过高的响应延迟,因此缓存应运而生.无论是单机缓存还是分布式缓存都有其适应场景和优缺点,当今存在的缓存产品也是数不胜数,最常见的有redis和memcached等,既然是分布式,那么他们是怎么实现分布式的呢?本文主要介绍分布式缓存服务mencached的分布式实现原理. memcached 缓存 分布式缓存 目录[-] 摘要 缓存本质 计算机体系缓存 缓存应用系统 memcached简介 什么是memcached m

memcached分布式缓存

1.memcached分布式简介 memcached虽然称为“分布式”缓存服务器,但服务器端并没有“分布式”功能.Memcache集群主机不能够相互通信传输数据,它的“分布式”是基于客户端的程序逻辑算法进一步实现的. 请看下面简图: 根据上图我们简述分析分布式memcached的set与get的过程 set过程: 1.首先通过应用程序set(‘key’,’value’) 2.进入程序,使用key通过逻辑算法得出这个key需要存储的节点位置 3.根据节点位置连接相应的memcached服务器,并发

基于Solr和Zookeeper的分布式搜索方案的配置

1.1 什么是SolrCloud SolrCloud(solr 云)是Solr提供的分布式搜索方案,当你需要大规模,容错,分布式索引和检索能力时使用 SolrCloud.当一个系统的索引数据量少的时候是不需要使用SolrCloud的,当索引量很大,搜索请求并发很高,这时需要使用SolrCloud来满足这些需求. SolrCloud是基于Solr和Zookeeper的分布式搜索方案,它的主要思想是使用Zookeeper作为集群的配置信息中心. 它有几个特色功能: 1)集中式的配置信息 2)自动容错