redis 持久化之 RDB & AOF

Redis 持久化实现方式

  • 快照
    对数据某一时间点的完整备份。例如Linux 快照备份、Redis RDB、MySQL Dump。
  • 日志
    将数据的所有操作都记录到日志中,需要恢复时,将日志重新执行一次。MySQL biglog、Redis AOF。
RDB

什么是 RDB

将redis内存中的数据,完整的生成一个快照,以.rdb结尾的文件保存在硬盘上,当需要恢复时,再从文件加载到内存中。

RDB 三种触发方式
  • save命令触发(同步)
[[email protected] ~]$ redis-cli
127.0.0.1:6379> save
OK

save执行时,会造成Redis的阻塞。所有数据操作命令都要排队等待它完成。
文件策略:新生成一个新的临时文件,当save执行完后,用新的替换老的。

  • bgsave命令触发(异步)
[[email protected] ~]$ redis-cli
127.0.0.1:6379> bgsave
Background saving started

客户端对Redis服务器下达bgsave命令时,Redis会fork出一个子进程进行rdb文件的生成。当文件生成完毕后,子进程再反馈给主进程。fork子进程时也会阻塞,不过正常情况下fork过程都非常快的。
文件策略:与save命令相同。

  • 配置文件配置规则自动触发
配置 seconds changes 作用
save 900 1 900秒内改变1条数据、自动生成rdb文件
save 300 10 300秒内改变10条数据、自动生成rdb文件
save 60 10000 60秒内改变10000条数据、自动生成rdb文件

PS: 这三种规则都不建议使用。

RDB 自动规则配置

# 配置自动生成规则。一般不建议配置自动生成rdb文件
save 900 1
save 300 10
save 60 10000
# 指定rdb文件名
dbfilename dump-${port}.rdb
# 指定rdb文件目录
dir /opt/redis/data
# bgsave发生错误,停止写入
stop-writes-on-bgsave-error yes
# rdb文件采用压缩格式
rdbcompression yes
# 对rdb文件进行校验
rdbchecksum yes
RDB 不容忽略的触发方式

  • 全量复制
    主从复制时,主会自动生成rdb文件(主从就是依据rdb文件进行数据同步)。
  • debug reload
    redis提供了debug级的重启,不清空内存的一种重启方式,也会生成rdb文件。
  • shutdown
    关闭redis会触发rdb文件生成。
RDB 存在的问题

  • 耗时、耗内存、耗IO性能
    将内存中的数据全部dump到硬盘当中,耗时。bgsave的方式fork()子进程耗额外内存。大量的硬盘读写耗费IO性能。
  • 不可控、丢失数据
    宕机时,上次快照之后写入的内存数据,将会丢失。
RDB 总结

  • RDB是Redis内存到硬盘的快照,用于持久化。
  • save通常会阻塞redis。
  • bgsave通常不会阻塞redis,但是会fork新进程。
  • save自动配置满足任一就会被执行。
  • 耗时、耗内存、耗IO性能
  • 不可控、丢失数据
AOF

什么是 AOF

就是写日志,每次执行Redis写命令,让命令同时记录日志(以.aof结尾的日志文件)。Redis宕机时,只要进行日志回放就可以恢复数据。

AOF 三种策略


首先redis执行写命令将命令刷新到硬盘缓冲区中

  • always
    总是让缓冲区文件刷新到硬盘(即使性)。
  • everysec(推荐)
    每秒刷新一次缓冲区同步硬盘数据。
    对比always,在高写入量的情况下,可以保护硬盘。出故障时会丢失一秒数据
  • no
    刷新策略让系统决定(不可控)。
  • 三种策略对比
命令 优点 缺点
always 不丢失数据 IO开销大,一般的sata盘只有几百TPS
everysec 只丢一秒数据 丢了一秒数据
no 系统决定 不可控,不知道什么时候刷盘,也不知道会丢失多少数据

通常使用everysec策略,这也是AOF的默认策略。

AOF 重写


AOF重写就是把过期的、没用的、重复的以及可优化的命令,进行化简。只取最终有价值的结果。虽然写入操作很频繁,但系统定义的key的量是相对有限的。
AOF重写可以大大压缩最终日志文件的大小。从而减少磁盘占用量,加快数据恢复速度。比如我们有个计数的服务,有很多自增的操作,比如有一个key自增到1个亿,对AOF文件来说就是一亿次incr。AOF重写就只用记1条记录。

AOF 重写两种方式

  • bgrewriteaof 命令触发AOF重写
    redis客户端向Redis发bgrewriteaof命令,redis服务端fork一个子进程去完成AOF重写。这里的AOF重写,是将Redis内存中的数据进行一次回溯,回溯成AOF文件。而不是重写AOF文件生成新的AOF文件去替换。
  • AOF 重写配置
    • auto-aof-rewrite-min-size:AOF文件重写需要的尺寸
    • auto-aof-rewrite-percentage:AOF文件增长
    • aof_current_size:统计AOF当前尺寸(单位:字节)
    • aof_base_size:AOF上次启动和重写的尺寸(单位:字节)
  • AOF自动重写的触发时机,需同时满足以下两点:
    • aof_current_size > auto-aof-rewrite-min-size
    • aof_current_size - aof_base_size/aof_base_size > auto-aof-rewrite-percentage
AOF 重写配置

# 开启正常AOF的append刷盘操作
appendonly yes
# AOF文件名
appendfilename "appendonly-${port}.aof"
# 每秒刷盘
appendfsync everysec
# 文件目录
dir /opt/redis/data
# AOF重写增长率
auto-aof-rewrite-percentage 100
# AOF重写最小尺寸
auto-aof-rewrite-min-size 64mb
# AOF重写期间是否暂停append操作。AOF重写非常消耗磁盘性能,而正常的AOF过程中也会往磁盘刷数据。
# 通常偏向考虑性能,设为yes。万一重写失败了,这期间正常AOF的数据会丢失,因为我们选择了重写期间放弃了正常AOF刷盘。
no-appendfsync-on-rewrite yes
RDB & AOF

RDB 对比 AOF

命令 RDB AOF 说明
启动优先级 RDB和AOF都开启的情况下,Redis重启后,选择AOF进行恢复。大部分情况下它保存了比RDB更新的数据
体积 RDB二进制模式存储,而且做了压缩。AOF虽然有AOF重写,但是体积相对还是大很多,毕竟它是记日志形式
恢复速度 RDB体积小,恢复速度快。AOF体积大,恢复速度慢
数据安全 丢数据 根据策略决定 RDB丢上次快照后的数据,AOF根据always、everysec、no策略决定是否丢数据
轻重 AOF是追加日志,所以比较轻的操作。而RDB是CPU密集型操作,对磁盘,以及fork时对内存的消耗都比较大
RDB 最佳策略

  • 建议关闭RDB
    无论是Redis主节点,还是从节点,都建议关掉RDB。但是关掉不是绝对的,主从复制时还是会借助RDB。
  • 用作数据备份
    RDB虽然是很重的操作,但是对数据备份很有作用。文件大小比较小,可以按天或按小时进行数据备份。
  • 主从,从开?
    在极个别的场景下,需要在从节点开RDB,可以再本地保存这样子的一个历史的RDB文件。虽然从节点不进行读写,但是Redis往往单机多部署,由于RDB是个很重的操作,所以还是会对CPU、硬盘和内存造成一定影响。根据实际需求进行设定。
AOF 最佳策略

  • 建议开启AOF
    如果Redis数据只是用作数据源的缓存,并且缓存丢失后从数据源重新加载不会对数据源造成太大压力,这种情况下。AOF可以关。
  • AOF重写集中管理
    单机多部署情况下,发生大量fork可能会内存爆满。
  • everysec
    建议采用每秒刷盘策略
最佳策略

  • 小分片
    使用maxmemary对Redis最大内存进行规划。
  • 缓存和存储
    根据缓存和存储的特性来决定使用哪种策略
  • 监控(硬盘、内存、负载、网络)
  • 足够的内存
    不要把就机器全部的内存规划给Redis。不然会出很多问题。像客户端缓冲区等,不受maxmemary限制。规划不当可能会产生SWAP、OOM等问题。
开发运维常见问题

fork 操作


fork是一个同步操作。执行bgsave和bgrewriteaof时都会执行fork操作

  • 改善fork

    • 优先使用物理机或者其他能高效支持form操作的虚拟化技术;
    • 控制Redis实例最大可用内存maxmemary;
      fork操作只是执行内存页的拷贝,大部分情况速度是比较快的。redis内存越大,内存页越大。可以使用maxmemary规划redis内存,避免fork过慢。
    • 合理配置Linux内存分配策略:vm.overcommit_memory=1
      fork时如果内存不够,会阻塞。Linux的vm.overcommit_memory默认为0,不会分配额外内存
子进程开销和优化


bgsave和bgrewriteaof会进行fork操作产生子进程。

  • CPU

    • 开销:RDB和AOF文件生成属于CPU密集型;
    • 优化:不做CPU绑定,不和CPU密集型应用部署在一起;
  • 内存
    • 开销:fork内存开销
    • 优化:echo never > /sys/kernel/mm/transparent_hugepage/enabled
  • 硬盘
    • 开销:AOF和RDB文件写入,可以结合iostat和iotao分析
    • 优化:
      • 不要和高硬盘负载服务部署在一起:存储服务、消息队列;
      • no-appendfsync-on-rewrite=yes;
      • 根据写入量决定磁盘类型:例如sdd;
      • 单机多实例持久化文件目录可以考虑分盘;
AOF 追加阻塞


AOF阻塞定位

  • redis日志
Asynchronous AOF fsync is taking to long(disk is busy?). Writing the AOF
buffer whitout waiting for fsync to complete, this may slow down Redis
  • info persistence
    可以查看上述日志发生的次数:
127.0.0.1:6379> info persistence
......
......
aof_delayed_fsync: 100
......
......

改善方式

同子进程的硬盘优化

PS: 更多文章请关注微信公众号:浮话

原文地址:https://www.cnblogs.com/jie-hu/p/10952855.html

时间: 2024-10-10 23:42:20

redis 持久化之 RDB & AOF的相关文章

Redis持久化之rdb&aof

Redis有两种持久化的方式:快照(RDB文件)和追加式文件(AOF文件) RDB持久化方式是在一个特定的间隔保存某个时间点的一个数据快照. AOF(Append only file)持久化方式则会记录每一个服务器收到的写操作.数据回复时,这些记录的操作会逐条执行从而重建出原来的数据.写操作命令  记录的格式跟Redis协议一致,以追加的方式进行保存. Redis的持久化是可以禁用的,两种方式的持久化是可以同时存在的,但是当Redis重启时,AOF文件会被优先用于重建数据. 一.RDB RDB就

Redis两种持久化方式(RDB&AOF)

爬虫和转载请注明原文地址;博客园蜗牛:http://www.cnblogs.com/tdws/p/5754706.html Redis所需内存 超过可用内存怎么办 Redis修改数据多线程并发—Redis并发锁 windows下redis基础操作与主从复制 从而 数据备份和读写分离 Redis两种持久化方式(RDB&AOF) Redis的持久化过程中并不需要我们开发人员过多的参与,我们要做的是什么呢?除了深入了解RDB和AOF的作用原理,剩下的就是根据实际情况来制定合适的策略了,再复杂一点,也就

redis持久化策略RDB和AOF

Redis 持久化: redis 提供了多种不同级别的持久化方式:一种是RDB,另一种是AOF. RDB 持久化可以在指定的时间间隔内生成数据集的时间点快照(point-in-time snapshot). AOF 持久化记录服务器执行的所有写操作命令,并在服务器启动时,通过重新执行这些命令来还原数据集. AOF 文件中的命令全部以 Redis 协议的格式来保存,新命令会被追加到文件的末尾. Redis 还可以在后台对 AOF 文件进行重写(rewrite),使得 AOF 文件的体积不会超出保存

Redis持久化方式RDB与AOF详解

前言 Redis提供了两种数据存储方式,分别是:cache-only && persistence:cache-only顾名知义,是用与缓存服务的,数据在服务器终止后将消失,在此模式下将不存在"数据恢复"的方式,是一种安全性低.效率高.易扩展的模式:persistence即内存中的数据持久备份至磁盘文件中,在服务重启之后能够恢复数据,这种模式下数据的安全性大大提高.cache-only没有什么讲的,这里主要说明Redis的持久化存储模式.对于persistence持久化

Redis 持久化之RDB和AOF

1. Redis 有两种持久化方案,RDB (Redis DataBase)和 AOF (Append Only File). RDB: Redis 默认的持久化方案.在指定的时间间隔内,执行指定次数的写操作,则会将内存中的数据写入到磁盘中.即在指定目录下生成一个dump.rdb文件.Redis 重启会通过加载dump.rdb文件恢复数据. AOF:Redis 默认不开启.它的出现是为了弥补RDB的不足(数据的不一致性),所以它采用日志的形式来记录每个写操作,并追加到文件中.Redis 重启的会

【Redis源码剖析】 - Redis持久化之RDB

原创作品,转载请标明:http://blog.csdn.net/xiejingfa/article/details/51553370 Redis是一个高效的内存数据库,所有的数据都存放在内存中.我们知道,内存中的信息会随着进程的退出或机器的宕机而消失.为此,Redis提供了两种持久化机制:RDB和AOF.这两种持久化方式的原理实际上就是把内存中所有数据的快照保存到磁盘文件上,以避免数据丢失. 今天我们主要来介绍一下RDB持久化机制RDB的实现原理,涉及的文件为rdb.h和rdb.c. RDB的主

redis持久化之RDB

rdb和aof两种持久化机制 RDB:snapshot --> 存储的格式为二进制格式,是默认的持久化方式:按事先定制的策略,周期性地将数据从内存中读取保存到磁盘:数据文件默认为dump.rdb 所以rdb保存机制有两种: a.客户端也可以显式使用save或bgsave命令启动快照保存机制 b.在配置文件中使用保存策略进行保存 save:同步保存的:在主线程中保存快照,此时会阻塞所有客户端请求(如果内存中有大量数据,将会阻断客户请求的时间比较久) bgsave:异步保存的:主进程不会被阻塞,不影

redis持久化机制之AOF与RDB

什么是redis Redis是一种面向"key-value"类型数据的分布式NoSQL数据库系统,具有高性能.持久存储.适应高并发应用场景等优势.它虽然起步较晚,但发展却十分迅速. redis为何需要持久化 由于Redis的数据都存放在内存中,如果没有配置持久化,redis重启后数据就全丢失了,于是需要开启redis的持久化功能,将数据保存到磁盘上,当redis重启后,可以从磁盘中恢复数据.redis提供两种方式进行持久化:用于crash后,redis的恢复. 一种是RDB持久化(原理

redis++:Redis持久化中 rdb 备份策略中的配置参数

save 900 1 # 时间策略 save 300 10 # 时间策略 save 60 10000 # 时间策略 dbfilename dump.rdb   #文件名称 dir /home/work/app/redis/data/    #文件保存路径 stop-writes-on-bgsave-error yes   # 如果持久化出错,主进程是否停止写入 rdbcompression yes    # 是否压缩 rdbchecksum yes     # 导入时是否检查 那么为什么需要配置