一文掌握Redis的三种集群方案

在开发测试环境中，我们一般搭建Redis的单实例来应对开发测试需求，但是在生产环境，如果对可用性、可靠性要求较高，则需要引入Redis的集群方案。虽然现在各大云平台有提供缓存服务可以直接使用，但了解一下其背后的实现与原理总还是有些必要（比如面试），本文就一起来学习一下Redis的几种集群方案。

Redis支持三种集群方案

主从复制模式
Sentinel（哨兵）模式
Cluster模式

主从复制模式

1. 基本原理

主从复制模式中包含一个主数据库实例（master）与一个或多个从数据库实例（slave），如下图

客户端可对主数据库进行读写操作，对从数据库进行读操作，主数据库写入的数据会实时自动同步给从数据库。

具体工作机制为：

2. 部署示例

本示例基于Redis 5.0.3版。

redis.conf的主要配置

###网络相关###

# bind 127.0.0.1 # 绑定监听的网卡IP，注释掉或配置成0.0.0.0可使任意IP均可访问

protected-mode no # 关闭保护模式，使用密码访问

port 6379  # 设置监听端口，建议生产环境均使用自定义端口

timeout 30 # 客户端连接空闲多久后断开连接，单位秒，0表示禁用

###通用配置###

daemonize yes # 在后台运行

pidfile /var/run/redis_6379.pid  # pid进程文件名

logfile /usr/local/redis/logs/redis.log # 日志文件的位置

###RDB持久化配置###

save 900 1 # 900s内至少一次写操作则执行bgsave进行RDB持久化

save 300 10

save 60 10000

# 如果禁用RDB持久化，可在这里添加 save ""

rdbcompression yes #是否对RDB文件进行压缩，建议设置为no，以（磁盘）空间换（CPU）时间

dbfilename dump.rdb # RDB文件名称

dir /usr/local/redis/datas # RDB文件保存路径，AOF文件也保存在这里

###AOF配置###

appendonly yes # 默认值是no，表示不使用AOF增量持久化的方式，使用RDB全量持久化的方式

appendfsync everysec # 可选值 always， everysec，no，建议设置为everysec

###设置密码###

requirepass 123456 # 设置复杂一点的密码

部署主从复制模式只需稍微调整slave的配置，在redis.conf中添加

replicaof 127.0.0.1 6379 # master的ip，port

masterauth 123456 # master的密码

replica-serve-stale-data no # 如果slave无法与master同步，设置成slave不可读，方便监控脚本发现问题

本示例在单台服务器上配置master端口6379，两个slave端口分别为7001,7002，启动master，再启动两个slave

[root@dev-server-1 master-slave]# redis-server master.conf

[root@dev-server-1 master-slave]# redis-server slave1.conf

[root@dev-server-1 master-slave]# redis-server slave2.conf

进入master数据库，写入一个数据，再进入一个slave数据库，立即便可访问刚才写入master数据库的数据。如下所示

[root@dev-server-1 master-slave]# redis-cli

127.0.0.1:6379> auth 123456

OK

127.0.0.1:6379> set site blog.jboost.cn

OK

127.0.0.1:6379> get site

"blog.jboost.cn"

127.0.0.1:6379> info replication

# Replication

role:master

connected_slaves:2

slave0:ip=127.0.0.1,port=7001,state=online,offset=13364738,lag=1

slave1:ip=127.0.0.1,port=7002,state=online,offset=13364738,lag=0

...

127.0.0.1:6379> exit

[root@dev-server-1 master-slave]# redis-cli -p 7001

127.0.0.1:7001> auth 123456

OK

127.0.0.1:7001> get site

"blog.jboost.cn"

执行info replication命令可以查看连接该数据库的其它库的信息，如上可看到有两个slave连接到master

3. 主从复制的优缺点

优点：

缺点：

Sentinel（哨兵）模式

1. 基本原理

哨兵模式基于主从复制模式，只是引入了哨兵来监控与自动处理故障。如图

哨兵顾名思义，就是来为Redis集群站哨的，一旦发现问题能做出相应的应对处理。其功能包括

哨兵模式的具体工作机制：

在配置文件中通过 sentinel monitor <master-name> <ip> <redis-port> <quorum> 来定位master的IP、端口，一个哨兵可以监控多个master数据库，只需要提供多个该配置项即可。哨兵启动后，会与要监控的master建立两条连接：

_sentinel_:hello

与master建立连接后，哨兵会执行三个操作：

_sentinel_:hello

发送INFO命令可以获取当前数据库的相关信息从而实现新节点的自动发现。所以说哨兵只需要配置master数据库信息就可以自动发现其slave信息。获取到slave信息后，哨兵也会与slave建立两条连接执行监控。通过INFO命令，哨兵可以获取主从数据库的最新信息，并进行相应的操作，比如角色变更等。

接下来哨兵向主从数据库的_sentinel_:hello频道发送信息与同样监控这些数据库的哨兵共享自己的信息，发送内容为哨兵的ip端口、运行id、配置版本、master名字、master的ip端口还有master的配置版本。这些信息有以下用处：

如果被PING的数据库或者节点超时（通过 sentinel down-after-milliseconds master-name milliseconds 配置）未回复，哨兵认为其主观下线（sdown，s就是Subjectively —— 主观地）。如果下线的是master，哨兵会向其它哨兵发送命令询问它们是否也认为该master主观下线，如果达到一定数目（即配置文件中的quorum）投票，哨兵会认为该master已经客观下线（odown，o就是Objectively —— 客观地），并选举领头的哨兵节点对主从系统发起故障恢复。若没有足够的sentinel进程同意master下线，master的客观下线状态会被移除，若master重新向sentinel进程发送的PING命令返回有效回复，master的主观下线状态就会被移除

哨兵认为master客观下线后，故障恢复的操作需要由选举的领头哨兵来执行，选举采用Raft算法：

选出领头哨兵后，领头者开始对系统进行故障恢复，从出现故障的master的从数据库中挑选一个来当选新的master,选择规则如下：

挑选出需要继任的slave后，领头哨兵向该数据库发送命令使其升格为master，然后再向其他slave发送命令接受新的master，最后更新数据。将已经停止的旧的master更新为新的master的从数据库，使其恢复服务后以slave的身份继续运行。

2. 部署演示

本示例基于Redis 5.0.3版。

哨兵模式基于前文的主从复制模式。哨兵的配置文件为sentinel.conf，在文件中添加

sentinel monitor mymaster 127.0.0.1 6379 1 # mymaster定义一个master数据库的名称，后面是master的ip， port，1表示至少需要一个Sentinel进程同意才能将master判断为失效，如果不满足这个条件，则自动故障转移（failover）不会执行

sentinel auth-pass mymaster 123456 # master的密码

sentinel down-after-milliseconds mymaster 5000 # 5s未回复PING，则认为master主观下线，默认为30s

sentinel parallel-syncs mymaster 2  # 指定在执行故障转移时，最多可以有多少个slave实例在同步新的master实例，在slave实例较多的情况下这个数字越小，同步的时间越长，完成故障转移所需的时间就越长

sentinel failover-timeout mymaster 300000 # 如果在该时间（ms）内未能完成故障转移操作，则认为故障转移失败，生产环境需要根据数据量设置该值

一个哨兵可以监控多个master数据库，只需按上述配置添加多套

分别以26379,36379,46379端口启动三个sentinel

[root@dev-server-1 sentinel]# redis-server sentinel1.conf --sentinel

[root@dev-server-1 sentinel]# redis-server sentinel2.conf --sentinel

[root@dev-server-1 sentinel]# redis-server sentinel3.conf --sentinel

也可以使用redis-sentinel sentinel1.conf 命令启动。此时集群包含一个master、两个slave、三个sentinel，如图，

我们来模拟master挂掉的场景，执行 kill -9 3017 将master进程干掉，进入slave中执行 info replication查看，

[root@dev-server-1 sentinel]# redis-cli -p 7001

127.0.0.1:7001> auth 123456

OK

127.0.0.1:7001> info replication

# Replication

role:slave

master_host:127.0.0.1

master_port:7002

master_link_status:up

master_last_io_seconds_ago:1

master_sync_in_progress:0

# 省略

127.0.0.1:7001> exit

[root@dev-server-1 sentinel]# redis-cli -p 7002

127.0.0.1:7002> auth 123456

OK

127.0.0.1:7002> info replication

# Replication

role:master

connected_slaves:1

slave0:ip=127.0.0.1,port=7001,state=online,offset=13642721,lag=1

# 省略

可以看到slave 7002已经成功上位晋升为master（role：master），接收一个slave 7001的连接。此时查看slave2.conf配置文件，发现replicaof的配置已经被移除了，slave1.conf的配置文件里replicaof 127.0.0.1 6379 被改为 replicaof 127.0.0.1 7002。重新启动master，也可以看到master.conf配置文件中添加了replicaof 127.0.0.1 7002的配置项，可见大哥（master）下位后，再出来混就只能当当小弟（slave）了，三十年河东三十年河西。

3. 哨兵模式的优缺点

优点：

缺点：

Cluster模式

1. 基本原理

哨兵模式解决了主从复制不能自动故障转移，达不到高可用的问题，但还是存在难以在线扩容，Redis容量受限于单机配置的问题。Cluster模式实现了Redis的分布式存储，即每台节点存储不同的内容，来解决在线扩容的问题。如图

Cluster采用无中心结构,它的特点如下：

Cluster模式的具体工作机制：

Cluster模式集群节点最小配置6个节点(3主3从，因为需要半数以上)，其中主节点提供读写操作，从节点作为备用节点，不提供请求，只作为故障转移使用。

2. 部署演示

本示例基于Redis 5.0.3版。

Cluster模式的部署比较简单，首先在redis.conf中

port 7100 # 本示例6个节点端口分别为7100,7200,7300,7400,7500,7600

daemonize yes # r后台运行

pidfile /var/run/redis_7100.pid # pidfile文件对应7100,7200,7300,7400,7500,7600

cluster-enabled yes # 开启集群模式

masterauth passw0rd # 如果设置了密码，需要指定master密码

cluster-config-file nodes_7100.conf # 集群的配置文件，同样对应7100,7200等六个节点

cluster-node-timeout 15000 # 请求超时 默认15秒，可自行设置

分别以端口7100,7200,7300,7400,7500,7600 启动六个实例(如果是每个服务器一个实例则配置可一样)

[root@dev-server-1 cluster]# redis-server redis_7100.conf

[root@dev-server-1 cluster]# redis-server redis_7200.conf

...

然后通过命令将这个6个实例组成一个3主节点3从节点的集群，

redis-cli --cluster create --cluster-replicas 1 127.0.0.1:7100 127.0.0.1:7200 127.0.0.1:7300 127.0.0.1:7400 127.0.0.1:7500 127.0.0.1:7600 -a passw0rd

执行结果如图

可以看到 7100， 7200， 7300 作为3个主节点，分配的slot分别为 0-5460， 5461-10922， 10923-16383， 7600作为7100的slave， 7500作为7300的slave，7400作为7200的slave。

我们连接7100设置一个值

[root@dev-server-1 cluster]# redis-cli -p 7100 -c -a passw0rd

Warning: Using a password with '-a' or '-u' option on the command line interface may not be safe.

127.0.0.1:7100> set site blog.jboost.cn

-> Redirected to slot [9421] located at 127.0.0.1:7200

OK

127.0.0.1:7200> get site

"blog.jboost.cn"

127.0.0.1:7200>

注意添加 -c 参数表示以集群模式，否则报 (error) MOVED 9421 127.0.0.1:7200 错误，以 -a 参数指定密码，否则报(error) NOAUTH Authentication required错误。

从上面命令看到key为site算出的slot为9421，落在7200节点上，所以有Redirected to slot [9421] located at 127.0.0.1:7200，集群会自动进行跳转。因此客户端可以连接任何一个节点来进行数据的存取。

通过cluster nodes可查看集群的节点信息

127.0.0.1:7200> cluster nodes

eb28aaf090ed1b6b05033335e3d90a202b422d6c 127.0.0.1:7500@17500 slave c1047de2a1b5d5fa4666d554376ca8960895a955 0 1584165266071 5 connected

4cc0463878ae00e5dcf0b36c4345182e021932bc 127.0.0.1:7400@17400 slave 5544aa5ff20f14c4c3665476de6e537d76316b4a 0 1584165267074 4 connected

dbbb6420d64db22f35a9b6fa460b0878c172a2fb 127.0.0.1:7100@17100 master - 0 1584165266000 1 connected 0-5460

d4b434f5829e73e7e779147e905eea6247ffa5a2 127.0.0.1:7600@17600 slave dbbb6420d64db22f35a9b6fa460b0878c172a2fb 0 1584165265000 6 connected

5544aa5ff20f14c4c3665476de6e537d76316b4a 127.0.0.1:7200@17200 myself,master - 0 1584165267000 2 connected 5461-10922

c1047de2a1b5d5fa4666d554376ca8960895a955 127.0.0.1:7300@17300 master - 0 1584165268076 3 connected 10923-16383

我们将7200通过 kill -9 pid杀死进程来验证集群的高可用，重新进入集群执行cluster nodes可以看到7200 fail了，但是7400成了master，重新启动7200，可以看到此时7200已经变成了slave。

3. Cluster模式的优缺点

优点：

缺点：

Redis Cluster模式不建议使用pipeline和multi-keys操作，减少max redirect产生的场景。

总结

本文介绍了Redis集群方案的三种模式，其中主从复制模式能实现读写分离，但是不能自动故障转移；哨兵模式基于主从复制模式，能实现自动故障转移，达到高可用，但与主从复制模式一样，不能在线扩容，容量受限于单机的配置；Cluster模式通过无中心化架构，实现分布式存储，可进行线性扩展，也能高可用，但对于像批量操作、事务操作等的支持性不够好。三种模式各有优缺点，可根据实际场景进行选择。

参考：

作者：空山新雨，一枚仍在学习路上的大龄码农

近期作者写了几十篇技术博客，内容包括Java、Spring Boot、Spring Cloud、Docker，技术管理心得等

欢迎关注作者微信公众号：空山新雨的技术空间，一起学习成长

一文掌握Redis的三种集群方案

主从复制模式

1. 基本原理

2. 部署示例

3. 主从复制的优缺点

Sentinel（哨兵）模式

1. 基本原理

2. 部署演示

3. 哨兵模式的优缺点

Cluster模式

1. 基本原理

2. 部署演示

3. Cluster模式的优缺点

总结

一文掌握Redis的三种集群方案的相关教程结束。

相关推荐

怎么用NestJS+Redis实现缓存

SpringCloud之Config配置中心与Redis分布式锁介绍

MySQL与redis缓存怎么实现同步

怎么在Redis上对Java执行分布式MapReduce

如何使用ratelimiter-spring-boot-starter限流器

SpringBoot+Redis如何执行lua脚本

Redis内存碎片产生原因及Pipeline管道原理是什么

Redis如何使用pipeline