分布式id生成算法

大家在准备后端面试时，肯定遇到过分布式系统设计相关的问题。今天就来聊一个高频考点：分布式ID生成算法。这类问题看似基础，却是评估候选人分布式系统设计能力的关键点。一起来分析几种主流方案及其优劣吧！

2025年Java面试宝典最新版！🔥 点击获取 >> (提取码: 9b3g)

为什么需要分布式ID?

想象你在设计电商系统：订单表如果只用数据库自增ID，分库分表后就会出现重复ID！分布式ID生成算法的核心目标就三点：

全局唯一性 - 整个系统绝不重复
高可用性 - 每秒生成上万ID不挂
趋势递增 - 利于数据库索引性能

方案一：雪花算法（Snowflake）

面试中最常被问的就是雪花算法了。它的核心思路是把64位ID拆解成：

0 | 时间戳(41bit) | 机器ID(10bit) | 序列号(12bit)

优势：

去中心化生成，无需网络调用
每秒可生成400万+ ID（12bit序列号支持4096/ms）
时间戳保证趋势递增

致命坑：

时钟回拨问题！如果服务器时间被同步回退，会生成重复ID
机器ID需要手动配置，容器化部署时很头疼

方案二：数据库号段模式

面试鸭返利网当面试官问“不用第三方中间件怎么做？”，就该提这个方案了。核心步骤：

创建数据库表 id_generator，包含biz_type和max_id
服务启动时申请一个号段（例如max_id=1000，step=2000）
内存中消耗完2000个ID后再请求数据库

优化技巧：

双Buffer交替申请号段避免卡顿
号段用完80%时预加载下一段
美团Leaf开源方案就是典型实践

方案三：Redis原子操作

如果团队有Redis集群，可以这样实现：

INCR order_id_counter  # 返回1
INCRBY order_id_counter 1000 # 直接获取一批ID

注意事项：

必须用Redis Cluster避免单点故障
重启时通过AOF或RDB持久化恢复ID
大厂通常配合Lua脚本保证原子性

方案对比总结

| 方案 | 吞吐量 | 依赖 | 优劣势 | |----------------|-----------|-----------|---------------------------| | 雪花算法 | 超高 | 无 | 怕时钟回拨 | | 数据库号段 | 高 | 数据库 | 需要容灾设计 | | Redis | 超高 | Redis | 需保证持久化 |

如何回答面试官？

当被问到“选哪个方案”时，我的回答框架是：

业务场景先行：中小系统用雪花足够，大并发选Redis/号段
容灾设计：无论选哪种，必须考虑时钟回拨/DB宕机/Redis失效的应对
监控报警：ID生成速度、重复率等核心指标监控

最后分享个实用资源：需要系统准备面试的同学，可以看看 面试鸭会员 。最近还有福利活动👉 通过面试鸭返利网购买会员可返现25元 ，性价比超高！

（注：本文技术方案均来自一线大厂实践，建议结合2025 Java面试宝典系统学习分布式设计）