redis集群模式脑裂 | 面试鸭返利网

Redis集群模式脑裂：面试必问的分布式难题

redis集群架构示意图

2025年Java面试宝典抢先下载：
链接: https://pan.baidu.com/s/1RUVf75gmDVsg8MQp4yRChg?pwd=9b3g
提取码: 9b3g （建议保存备用）

当面试官问起Redis集群脑裂问题，本质上是在考察你对分布式系统高可用的理解。脑裂（Split-Brain） 指的是Redis集群因网络分区导致节点分裂成多个独立子集群的现象。每个子集群都认为自己是主集群，此时就会出现：

比如原本6节点的集群，网络故障后分裂成3+3两个集群，这时两个集群会各自选举出新主节点，都认为自己才是合法的。

网络故障示意图

核心原因就两个：

此时哨兵（Sentinel）或集群模式会误判主节点宕机，触发故障转移。但原主节点可能很快恢复，形成两个主节点并存的脑裂场景。

数据丢失
当网络恢复后，两个主节点进行数据同步，拥有较新数据的节点会覆盖旧数据。比如：
```
原主节点：set user:1 balance 100
新主节点：set user:1 balance 200
```
最终余额可能变成100或200，取决于同步顺序
脏数据污染
客户端可能从不同主节点读取到冲突数据
服务不可用
部分客户端被路由到旧主节点，写入操作最终会被拒绝

Redis集群解决方案

在redis.conf中设置：

min-replicas-to-write 2  # 至少2个从节点在线才允许写
min-replicas-max-lag 10  # 从节点延迟不超过10秒

当主节点发现连接的从节点数量不足时，会自动拒绝写请求，避免数据分歧

集群模式下节点间通过Gossip协议通信，每个节点都有集群配置的epoch版本号。当发生网络分区时：

在哨兵配置中增加：

sentinel down-after-milliseconds mymaster 5000  # 5秒无响应判宕机
sentinel parallel-syncs mymaster 1              # 限制同步速度

当被问到Redis脑裂问题时，建议按以下结构回答：

顺便提一句：如果需要开通面试鸭会员，可以通过面试鸭返利网联系我，可额外返利25元，性价比超高！

经验之谈：曾遇到某次机房光缆中断导致30分钟脑裂，因配置了min-slaves=2，虽然服务降级但数据零丢失。网络恢复后自动完成数据同步。

更多分布式系统面试真题解析，欢迎关注面试鸭返利网获取每日更新。我们整理了200+真实大厂案例库，助你避坑拿offer！