Redis研究（十二）—数据复制

在上一节中我们写了Redis的数据持久化

http://blog.csdn.net/wtyvhreal/article/details/42916503

通过持久化功能，Redis保证了即使在服务器重启的情况下也不会损失（或少量损失）数据。但是由于数据是存储在一台服务器上的，如果这台服务器的硬盘出现故障，也会导致数据丢失。为了避免单点故障，我们希望将数据库复制多个副本以部署在不同的服务器上，即使有一台服务器出现故障其他服务器依然可以继续提供服务。这就要求当一台服务器上的数据库更新后，可以自动将更新的数据同步到其他服务器上，Redis提供了复制（replication
）功能可以自动实现同步的过程。

1.配置

同步后的数据库分为两类，一类是主数据库（master），一类是从数据库（slave）。主数据库可以进行读写操作，当发生写操作时自动将数据同步给从数据库。而从数据库一般是只读的，并接受主数据库同步过来的数据。一个主数据库可以拥有多个从数据库，而一个从数据库只能拥有一个主数据库。

在Redis中使用复制功能非常容易，只需要在从数据库的配置文件中加入“slaveof主数据库IP主数据库端口”即可，主数据库无需进行任何配置。为了能够更直观地展示复制的流程，下面将进行简单的演示。我们要在一台服务器上启动两个Redis实例，监听不同端口，其中一个作为主数据库，另一个作为从数据库。首先我们不加任何参数来启动一个Redis实例作为主数据库：

redis-server

该实例默认监听6379端口。然后加上slaveof参数启动另一个Redis实例作为从数据库，并让其监听6380端口：

redis-server --port 6380 --slaveof 127.0.0.1 6379

此时在主数据库中的任何数据变化都会自动同步到从数据库中。我们打开redis-cli实例A并连接到主数据库：

redis-cli

再打开redis-cli实例B并连接到从数据库：

redis-cli -p 6380

在实例A中使用SET命令设置一个键的值：

redis A＞SET foo bar
OK

此时在实例B中就可以获得该值了：

redis B＞GET foo
"bar "

但在默认情况下从数据库是只读的，如果直接修改从数据库的数据会出现错误：

redis B＞SET foo hi
(error)

可以通过设置从数据库的配置文件中的slave-read-only 为no以使从数据库可写，但是对从数据库的任何更改都不会同步给任何其他数据库，并且一旦主数据库中更新了对应的数据就会覆盖从数据库中的改动。

配置多台从数据库的方法也一样，在所有的从数据库的配置文件中都加上 slaveof参数指向同一个主数据库即可。

除了通过配置文件或命令行参数设置slaveof参数，还可以在运行时使用SLAVEOF命令修改：

redis＞SLAVEOF  127.0.0.1 6379

如果该数据库已经是其他主数据库的从数据库了，SLAVEOF命令会停止和原来数据库的同步转而和新数据库同步。还可以使用SLAVEOFNO ONE来使当前数据库停止接收其他数据库的同步转成主数据库。

2.原理

当一个从数据库启动后，会向主数据库发送SYNC命令，主数据库接收到SYNC命令后会开始在后台保存快照（即RDB持久化的过程），并将保存期间接收到的命令缓存起来。当快照完成后，Redi s会将快照文件和所有缓存的命令发送给从数据库。从数据库收到后，会载入快照文件并执行收到的缓存的命令。当主从数据库断开重连后会重新执行上述操作，不支持断点续传。

实际的过程略微复杂一些，由于Redi s服务器使用TCP协议通信，所以我们可以使用telnet工具伪装成一个从数据库来了解同步的具体过程。首先在命令行中连接主数据库（默认端口为6379，且没有任何从数据库连接）：

telnet 127.0.0.1 6379
Trying 127.0.0.1...
Connected  to localhost.
Escape  cha acter  i s '^]' .

然后作为从数据库，我们先要发送PING命令确认主数据库是否可以连接：

PING
+PONG

主数据库会回复+PONG。如果没有收到主数据库的回复，则向用户提示错误。如果主数据库需要密码才能连接，我们还得发送AUTH命令进行验证。而后向主数据库发送REPLCONF命令说明自己的端口号（这里随便选择了一个）：

REPLCONF  l istening-por t 6381
+OK

这时就可以开始同步的过程了：向主数据库发送SYNC命令开始同步，此时主数据库发送回快照文件和缓存的命令。目前主数据库中只有一个foo键，所以收到的内容如下（快照文件是二进制格式，从第三行开始）：

SYNC
29
REDI S0006?foobar ?6_?"

从数据库会将收到的内容写入到硬盘上的临时文件中，当写入完成后从数据库会用该临时文件替换RDB快照文件（RDB快照文件的位置就是持久化时配置的位置，由dir和dbfilename两个参数确定），之后的操作就和RDB持久化时启动恢复的过程一样了。需要注意的是在同步的过程中从数据库并不会阻塞，而是可以继续处理客户端发来的命令。默认情况下，从数据库会用同步前的数据对命令进行响应。可以配置slave-serve-stale-data参数为no来使从数据库在同步完成前对所有命令（除了INFO和SLAVEOF）都回复错误：“SYNC
with master in progress.”

之后主数据库的任何数据变化都会同步给从数据库，同步的内容和Redis通信协议一样，比如我们在主数据库中执行SET foo hi，通过telnet我们收到了：

*3
$3
set
$3
foo
$2
hi

在复制的过程中，快照无论在主数据库还是从数据库中都起了很大的作用，只要执行复制就会进行快照，即使我们关闭了RDB方式的持久化（通过删除所有save参数）。更进一步，无论是否启用了RDB方式的持久化，Redis在启动时都会尝试读取dir和dbfilename两个参数指定的RDB文件来恢复数据库。

3.图结构

从数据库不仅可以接收主数据库的同步数据，自己也可以同时作为主数据库存在，形成类似图的结构，如图所示，数据库A的数据会同步到B和C中，而B中的数据会同步到D和E中。向B中写入数据不会同步到A或C中，只会同步到D和E中，

4.读写分离

通过复制可以实现读写分离以提高服务器的负载能力。在常见的场景中，读的频率大于写，当单机的Redis无法应付大量的读请求时（尤其是较耗资源的请求，比如SORT命令等）可以通过复制功能建立多个从数据库，主数据库只进行写操作，而从数据库负责读操作。

5.从数据库持久化

另一个相对耗时的操作是持久化，为了提高性能，可以通过复制功能建立一个（或若干个）从数据库，并在从数据库中启用持久化，同时在主数据库禁用持久化。当从数据库崩溃时重启后主数据库会自动将数据同步过来，所以无需担心数据丢失。而当主数据库崩溃时，需要在从数据库中使用SLAVEOF NO ONE命令将从数据库提升成主数据库继续服务，并在原来的主数据库启动后使用SLAVEOF命令将其设置成新的主数据库的从数据库，即可将数据同步回来。

时间： 2024-12-26 08:05:56

Redis研究（十二）—数据复制

Redis研究（十二）—数据复制的相关文章

Effective C++读书笔记之十二：复制对象时勿忘其每一个成分

Redis教程(十二)：服务器管理命令总结

Redis研究（二）—准备

Redis Cluster 集群数据分片机制

redis之（十二）redis数据的持久化

阿里，腾讯内部十二个大数据项目，你都有做过吗？

[WebGL入门]十二，模型数据和顶点属性

马哥学习笔记二十四——分布式复制快设备drbd

redis之（二十）redis的总结一

Android学习笔记（十二）——使用意图传递数据的几种方式