利用redis replication实现redis服务器热迁移
文章开头我先声明:标题过于高大上,主要是为了装逼。
某个月黑风高的夜晚,一只运维攻城狮和一只PHP程序猿在促膝长谈,只见PHP程序猿双眼目光呆滞的盯着眼前屏幕上的一坨坨代码状文本,突然问出一句:“这个你会搞吗?”语气中透着一股程序猿的傲娇与对运维这一行业的轻蔑。攻城狮显然感觉到了空气中的那一缕杀气,但为了不给这个行业丢脸,攻城狮还是傲娇的仰头,冷冷的说:“我瞅瞅!”
问题是这样的,程序员他们公司最近要更换一台redis服务器,但是更换的过程中还不能down机。根据网上提供的方法有两种,一种是把数据库down出来,然后在新的redis服务器上搞进去,然后切换。很明显,大家对于这种方案的态度就俩字:呵呵!
另外一种方法就是使用redis的主从同步方式来让新的服务器实时同步旧的服务器,等数据同步完成后,在将所有的请求趁旧服务器一个不注意的时候,噶本儿!转到新的服务器上,从此做一个毫无违和感的始乱终弃的服务器替换,小三在一片欢呼声中成功上位,噢耶!
想想如此跌宕起伏的剧情,攻城狮在夜里兴奋了,雄起了,然后果断开机,开虚拟机,搞起!然后……这是个悲伤的故事,攻城狮百度了一堆文档,发现redis主从同步配置竟然简单到令人发指!只需要在slave服务器的redis.conf配置文件中添加一行:
slaveof <masterIP> <masterport>
这样一条简单的配置,攻城狮熟练的操作着虚拟机,他开机了!!他配IP地址了!!他远程登录了!!他用yum装了redis了!!他开始配置redis了!!他那粗壮的手指在疯狂的打压键盘,他的嘴角开始微微扬起,他准备着迎接即将到来的胜利!!这个时候他感觉不是一个人!他的背后是整个运维行业的注视!!快看!!攻城狮启动服务了!!他开始测试了!!然后,测试失败了……
呵呵,真是一个悲伤的故事!
让我们来看一下配置的过程和问题所在:
两台虚拟机:
master的IP是192.168.31.118,没有做任何更改,启动了redis服务
slave的IP是192.168.31.200,在/etc/redis.conf文件中增加了一行配置:slaveof 192.168.1.118 6379
然后启动了redis服务。
测试的过程是在master服务器上,使用redis-cli客户端登录redis命令行界面,使用flushdb命令清空所有key(该过程只用于测试,真实环境中敲个这命令你就不用搞什么热迁移了),创建两个键值对:
然后到slave服务器上,使用redis-cli命令登录redis并使用命令key*来查看是否同步了数据,结果悲剧了:
想象中Duang~的一下就同步过来的数据卡壳了,数据不知道死哪去了!文档中就是这么写的啊,肿么搞不定了呢?
无奈,查日志呗,好在redis记录了日志,由于是slave没有同步到数据且master没做别的更改,那么问题很有可能就出在slave上,查看slave上的redis日志,以下是日志内容:
看到了么?多么痛的领悟!居然链接被拒绝?!搞毛线啊??!明明是照着网上的文档来的啊,而且不止一个文档这么配置啊,为毛如此坚决的拒绝一个单身狗的合理要求?!怒摔!!
攻城狮又一次被碾压了,程序猿眼角那束光是怎么回事?分明感到被歧视了呢!夜已深,第二天还得卖身的攻城狮含恨而睡去,睡梦中,攻城狮梦到了他成功解决问题的那一刹那,很美,很美……
好吧,故事并没有结束,就在第二天,攻城狮终于抽出了时间来解决别人公司的问题(老板还好不看我博客,不然后果很严重啊!)攻城狮不愧为攻城狮,他将目光转向了master服务器,看来master什么都不配置是不正确的。仔细观看配置文件时,攻城狮终于眼前一亮!他看到了在配置文件中有一行这样的配置:
bind 127.0.0.1
瞬间开窍,尼玛啊,坑爹啊,这个配置是用来限制允许哪些IP访问redis的啊,怎么网上的文档一致忽略这么一个关键配置啊!尼玛能不能少点转载,写文章的时候走走脑子啊喂!!这帮坑爹的小婊砸!!再次怒摔!!
然后,攻城狮放了个大招,将这个配置更改为:bind 0.0.0.0 是的,攻城狮开始疯狂的报复这个社会了!!改完以后重启redis,成功了,成功了!!!攻城狮那副大眼镜框子后面闪烁出了点点的泪光,他呢喃道:“终于TM的通了,F**K!”主从终于配置成功了!
你以为故事就这样结束了?!你还是太年轻!还有一条关键的配置配好吗?那就是在redis2.6以上,默认slave服务器是不允许执行写操作的,所以,这就注定了slave从工作的那一刻起就注定了是个备胎!哼哼,我们就是来拯救备胎的,所以果断在slave的配置中修改如下配置:
slave-read-only no
允许slave上执行写操作,没错,就是这么任性!如此一来,备胎就可以准备上位了,剩下的事情就交给开发,让其将redis服务器改到新的服务器上,改完后,在新的服务器上登录redis并执行命令:
SLAVEOF no one
至此,正式将slave从备胎扶上位!
虽然这只是一个简单的配置,但是作为一个运维工程师,不正是靠着这种一点一滴的积累,一步一步慢慢走向大牛道路的吗?运维说到底玩的不是技术,而是经验!运维还是老的辣!!