持久化方式
RDB持久化
Redis安装后默认支持的持久化方式。在指定的时间间隔内将内存中的数据集快照写入到磁盘。在配置文件中,通常默认的配置是每900秒至少有一个key发生变化时会持久化一次; 每300秒至少有10个key发生变化时会持久化一次; 每60秒10000次变化时持久化一次
优点
- RDB 是一个非常紧凑(compact)的文件,它保存了 Redis 在某个时间点上的数据集。 这种文件非常适合用于进行备份: 比如说,你可以在最近的 24 小时内,每小时备份一次 RDB 文件,并且在每个月的每一天,也备份一个 RDB 文件。 这样的话,即使遇上问题,也可以随时将数据集还原到不同的版本。
- RDB 非常适用于灾难恢复(disaster recovery):它只有一个文件,并且内容都非常紧凑,可以(在加密后)将它传送到别的数据中心,或者亚马逊 S3 中
- RDB 可以最大化 Redis 的性能:父进程在保存 RDB 文件时唯一要做的就是 fork 出一个子进程,然后这个子进程就会处理接下来的所有保存工作,父进程无须执行任何磁盘 I/O 操作。
- RDB 在恢复大数据集时的速度比 AOF 的恢复速度要快。
缺点
- 如果你需要尽量避免在服务器故障时丢失数据,那么 RDB 不适合你。 虽然 Redis 允许你设置不同的保存点(save point)来控制保存 RDB 文件的频率, 但是, 因为RDB 文件需要保存整个数据集的状态, 所以它并不是一个轻松的操作。 因此你可能会至少 5 分钟才保存一次 RDB 文件。 在这种情况下, 一旦发生故障停机, 你就可能会丢失好几分钟的数据。
- 每次保存 RDB 的时候,Redis 都要 fork() 出一个子进程,并由子进程来进行实际的持久化工作。 在数据集比较庞大时, fork() 可能会非常耗时,造成服务器在某某毫秒内停止处理客户端; 如果数据集非常巨大,并且 CPU 时间非常紧张的话,那么这种停止时间甚至可能会长达整整一秒。 虽然 AOF 重写也需要进行 fork() ,但无论 AOF 重写的执行间隔有多长,数据的耐久性都不会有任何损失。
AOF持久化
以日志的形式处理服务器所处理的每一个操作,当Redis重启后,它会读取日志文件来重新构建数据库。
优点
- 使用 AOF 持久化会让 Redis 变得非常耐久(much more durable):你可以设置不同的 fsync 策略,比如无 fsync ,每秒钟一次 fsync ,或者每次执行写入命令时 fsync 。 AOF 的默认策略为每秒钟 fsync 一次,在这种配置下,Redis 仍然可以保持良好的性能,并且就算发生故障停机,也最多只会丢失一秒钟的数据( fsync 会在后台线程执行,所以主线程可以继续努力地处理命令请求)。
- AOF 文件是一个只进行追加操作的日志文件(append only log), 因此对 AOF 文件的写入不需要进行 seek , 即使日志因为某些原因而包含了未写入完整的命令(比如写入时磁盘已满,写入中途停机,等等), redis-check-aof 工具也可以轻易地修复这种问题。
- Redis 可以在 AOF 文件体积变得过大时,自动地在后台对 AOF 进行重写: 重写后的新 AOF 文件包含了恢复当前数据集所需的最小命令集合。 整个重写操作是绝对安全的,因为 Redis 在创建新 AOF 文件的过程中,会继续将命令追加到现有的 AOF 文件里面,即使重写过程中发生停机,现有的 AOF 文件也不会丢失。 而一旦新 AOF 文件创建完毕,Redis 就会从旧 AOF 文件切换到新 AOF 文件,并开始对新 AOF 文件进行追加操作。
- AOF 文件有序地保存了对数据库执行的所有写入操作, 这些写入操作以 Redis 协议的格式保存, 因此 AOF 文件的内容非常容易被人读懂, 对文件进行分析(parse)也很轻松。 导出(export) AOF 文件也非常简单: 举个例子, 如果你不小心执行了 FLUSHALL 命令, 但只要 AOF 文件未被重写, 那么只要停止服务器, 移除 AOF 文件末尾的 FLUSHALL 命令, 并重启 Redis , 就可以将数据集恢复到 FLUSHALL 执行之前的状态。
缺点
- 对于相同的数据集来说,AOF 文件的体积通常要大于 RDB 文件的体积。
- 根据所使用的 fsync 策略,AOF 的速度可能会慢于 RDB 。 在一般情况下, 每秒 fsync 的性能依然非常高, 而关闭 fsync 可以让 AOF 的速度和 RDB 一样快, 即使在高负荷之下也是如此。 不过在处理巨大的写入载入时,RDB 可以提供更有保证的最大延迟时间(latency)。
- AOF 在过去曾经发生过这样的 bug : 因为个别命令的原因,导致 AOF 文件在重新载入时,无法将数据集恢复成保存时的原样。 (举个例子,阻塞命令 BRPOPLPUSH 就曾经引起过这样的 bug 。) 测试套件里为这种情况添加了测试: 它们会自动生成随机的、复杂的数据集, 并通过重新载入这些数据来确保一切正常。 虽然这种 bug 在 AOF 文件中并不常见, 但是对比来说, RDB 几乎是不可能出现这种 bug 的。
无持久化
通过配置来禁用Redis持久化功能。
同时使用RDB和AOF
RDB快照
默认情况下RDB的快照文件为dump.rdb
当Redis需要保存dump.rdb时,服务器会进行一下操作:
- Redis调用
fork()
, 同时拥有父进程和子进程。 - 子进程将数据集写入临时的RDB文件中。
- 当子进程完成对新RDB文件的写入时,Redis用新的RDB文件替换旧的RDB文件,并将旧的RDB文件删除。
AOF重写
因为AOF采用的是命令追加,因此随着命令的积累,AOF文件会越来越大,Redis就有必要进行AOF重建(rebuild)。
举个例子,用户调用了100次INCR,那么仅仅是为了保存这个计数器的当前值,AOF就需要100条记录(entry)。然而实际上只需要一个SET
命令保存计数器当前值,其余99条记录都是多余的。
为了处理这种情况,Redis支持一种有趣的特性: 可以在不打断服务器客户端的情况下,对AOF进行重建。执行BGREWRITEAOF
命令,Redis会生成一个新的AOF文件,这个文件会包含重建当前数据集所需的最少命令。
AOF fsync
你可以配置Redis多久才将数据fsync到磁盘一次
有三个选项:
- 每次有新命令追加到AOF就进行一次fsync : 非常慢,也非常安全
- 每秒fsync一次 : 足够块(跟RDB持久化差不多),并且故障只会损失1秒内的数据
- 从不fsync : 将数据交由操作系统来处理。更快,但也更不安全
通常推荐(也是默认)每秒进行一次fsync,这种策略可以兼顾速度和安全性。
总是fsync的策略在实际使用中非常慢,即使在 Redis 2.0 对相关的程序进行了改进之后仍是如此 —— 频繁调用 fsync 注定了这种策略不可能快得起来。
AOF运作方式
- Redis调用
fork()
, 同时拥有父进程和子进程。 - 子进程开始将新的AOF写入临时文件。
- 对于新执行的命令,父进程一边将其放入内存缓冲中,一边将这些改动追加到AOF文件末尾 : 这样即使在重写的中途发生停机,现有的AOF还是安全的。
- 当子进程完成重写工作时,它给父进程发送一个信号,父进程收到信号后将内存缓冲的所有数据追加到新AOF文件末尾。
- Redis原子第将新AOF文件替换旧AOF文件,之后的命令都会追加到新AOF文件末尾。