单机数据库的实现
原理
Redis服务器将所有数据库保存在服务器状态redis.h/redisServer结构的db数组中,db数组的每个项都是一个RedisDb结构,每个redisDb结构代表一个数据库。初始化服务器时,程序会根据服务器状态的dbnum属性来决定应该创建多少个数据库,dbnum属性的值由服务器配置的database选项决定,默认情况下,该选项的值为16,所以Redis服务器默认会创建16个数据库。
切换数据库
默认情况下,Redis客户端的目标数据库为0号数据库,但客户端可以通过执行SELECT命令来切换目标数据库。
键空间
每个数据库都由一个redis.h/redisDb结构表示,redisDb结构的dict字典保存了数据库中的所有键值对,将这个字典称为键空间。当使用Redis命令对数据库进行读写时,服务器不仅会对键空间执行指定的读写操作,还会执行一些额外的维护操作。比如读取一个键之后,服务器会更新键的最后一次使用时间,这个值可以用于计算键的闲置时间,使用OBJECT idletime命令可以查看键key的闲置时间。
设置键的生存时间或过期时间 EXPIRE/PEXPIRE key time
Redis的过期键删除策略:惰性删除和定期删除。
惰性删除:所有读写数据库的命令——调用expireIfNeeded函数——判断输入键是否已经过期——是,删除键
定期删除:周期性调用activeExpireCycle函数,函数每次运行时,都从一定数量的数据库中取出一定数量的随机键进行检查,并删除其中的过期键。全局变量current_db会记录当前的进度,下次开始时调用上一次进度进行处理。
数据库通知
数据库通知是Redis2.8版本新增加的功能,可以让客户端通过订阅给定的频道或者模式,来获知数据库中键的变化,以及数据库中命令的执行情况。
例如:[email protected]_ _:message
RDB持久化
因为Redis是内存数据库,它将自己的数据库状态储存在内存里面,Redis提供了RDB持久化功能,这个功能可以将Redis
在内存中的数据库状态保存到磁盘里面,避免数据意外丢失。RDB持久化既可以手动执行,也可以根据服务器配置选项定期执行,该功能可以讲某个时间点上的数据库状态保存到一个RDB文件中。RDB持久化功能所生成的RDB文件是一个经过压缩的二进制文件,通过该文件可以还原生成RDB文件时的数据库状态。因为RDB文件时保存在硬盘里面的,所以即使Redis服务器进程退出,甚至运行Redis服务器的计算机停机,只要RDB文件仍然存在,Redis服务器就可以用它来还原数据库状态。
RDB文件的创建与载入
SAVE和BGSAVE都可以用于生成RDB文件,SAVE命令会阻塞Redis服务器进程,直到RDB文件创建完毕为止,在服务器进程阻塞期间,服务器不能处理任何命令请求。
BGSAVE命令会派生出一个子进程,然后由子进程复杂创建RDB文件,服务器进程继续处理命令请求。
对于不同类型的键值对,RDB文件会使用不同的方式来保存。
AOF持久化
除了RDB持久化功能外,Redis还提供了AOF持久化功能。与RDB持久化通过保存数据库中键值对来记录数据库状态不同,AOF持久化是通过保存Redis服务器所执行的写命令来记录数据库状态。
因为AOF文件的更新频率通常比RDB文件的更新频率高,故
如果服务器开启了AOF持久化功能,那么服务器就会优先使用AOF文件来还原数据库状态;
只有在AOF持久化功能处于关闭状态时,服务器才会使用RDB文件来还原数据库状态。
redis > SET msg“hello”
redis > SADDfruits “apple” “banana”
redis > RPUSHnumbers 128 122 444
RDB持久化保存数据库状态的方法是将msg、fruits、numbers三个键的键值对保存到RDB文件中,而AOF持久化保存数据库状态的方法则是将服务器执行的SET、SADD、RPUSH三个命令保存到AOF文件中。
为提高文件的写入效率,在现在操作系统中,当用户调用write函数,将一些数据写入到文件的时候,操作系统通常会将写入数据暂时保存在一个内存缓冲区里面,等到缓冲区的空间被填满、或者超过指定时限后,才真正地将缓冲区中的数据写入到磁盘里面。
这种做法虽然提高了效率,但也为写入数据带来了安全问题,因为如果计算机停机,那么保存在内存缓冲区里面的写入数据将会丢失。
为此,系统提供了fsync和fdatasync两个同步函数,它们可以强制让操作系统立即将缓冲区中的数据写入到硬盘里面,从而确保写入数据的安全性。
服务器配置appendfsync选项的值直接决定AOF持久化功能的效率和安全性。
appendfsync的值为always时,服务器在每个事件循环都要将aof_buf缓存区中所有内容写入到AOF文件,并且同步AOF文件,效率最慢,但是最安全的。即使出现故障停机,AOF持久化也只会丢失一个事件循环中所产生的命令数据。
everysec: 服务器在每个事件循环都要将aof_buf缓存区中所有内容写入到AOF文件,并且每隔一秒就要在子线程中对AOF文件进行一次同步。效率快,就算出现故障,数据库也只丢失一秒种的命令数据。
no: 处于no模式下的flushAppendOnlyFile调用无须执行同步操作,所以该模式下的AOF文件写入速度总是最快的。不过因为这种模式会在系统缓存中积累一段时间的写入数据,所以该模式的单次同步时长通常是三种中最长的。