百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 编程网 > 正文

流行的分布式全局唯一ID解决方案 分布式唯一id生成策略

yuyutoo 2024-10-18 12:10 1 浏览 0 评论

唯一ID的设计在我们系统的开发中是非常重要的,几乎所有的系统设计都离不开ID编码,如电商订单编号、快递单号等。良好的ID编码设计能提高数据存储和检索的效率,便于分布式系统的部署。

这里我们对常用的几种ID编码方式进行整理和对比,以作抛砖引玉,相关算法对应不同编程语言的实现,网上都可以找到很多例子。


雪花算法

雪花算法(Snowflake),twitter公司内部分布式项目采用的ID生成算法,目前广受开发者的欢迎,所以这里做下简单介绍。

雪花算法ID的64位二进制结构如下:

  • 第一段1位为未使用,永远固定为0。
  • 第二段41位为毫秒级时间(41位的长度可以使用69年)。
  • 第三段10位为WorkerId(10位的长度最多支持部署1024个节点)。
  • 第四段12位为毫秒内的计数(12位的计数顺序号支持每个节点每毫秒产生4096个ID序号)。


业务中我们可以64位二进制转换成十进制长整型的形式。因为根据时间生成,所以它是有序的,数据检索性能高。

ID示例:27206497290486784

优点:

1、不依赖系统或者数据库。

2、性能好,稳定性高。

缺点:

1、时钟回拨:强依赖机器时间,如果机器上时钟修改回调,也有可能会导致主键重复的问题。

2、手动配置:WorkerId(机器ID)是需要部署时手动配置的,而且WorkerId不能重复,这在项目部署的时候需要特别注意。


UUID / GUID

UUID(Universally Unique Identifier)通用标识码,GUID(Globals Unique Identifiers)全球唯一标识符。UUID 是一种标准,GUID 是 UUID 的实现之一。UUID编码结构如下:

  • 1~8位采用系统时间,在系统时间上精确到毫秒级保证时间上的唯一性。
  • 9~16位采用底层的IP地址,在服务器集群中的惟一性。
  • 17~24位采用当前对象的HashCode值,在一个内部对象上的惟一性。
  • 25~32位采用调用方法的一个随机数,在一个对象内的毫秒级的唯一性。

ID示例:652b83c2-e18b-41d4-a266-55f63d12df0

优点:

  • 降低全局节点的压力,使得主键生成速度较快。
  • 跨服务器合并数据方便。

缺点:

  • UUID占用16个字符,空间占用较多。
  • 不是递增的有序数字,数据写入IO随机性大,因此检索效率会有所降低。


Redis自增

当使用数据库来生成ID性能不够要求的时候,我们可以尝试使用Redis来生成ID。这主要依赖于Redis是单线程的,所以也可以用生成全局唯一的ID。可以用Redis的原子操作 INCR 和 INCRBY 来实现。

优点:

  • 依赖于数据库,灵活方便,且性能优于数据库。
  • 数字ID天然排序,对分页或者需要排序的结果很有帮助。

缺点:

  • 如果系统中没有Redis,还需要引入新的组件,增加系统复杂度。
  • 需要编码和配置的工作量比较大。


数据库的主键自增

简单易实现,比较常用的ID生成方式,利用数据库自身的主键自增功能实现。

优点:

  • INT和BIGINT类型占用空间较小。
  • 主键自动增长,IO写入连续性好。
  • 数字类型查询速度优于字符串。

缺点:

  • 并发性能不高,受限于数据库性能。
  • 分库分表,需要改造,复杂。
  • 自增有规律,会导致数据泄露。


其他分布式ID

1、滴滴 TinyID

Github地址:GitHub - didi/tinyid: ID Generator id生成器 分布式id生成系统,简单易用、高性能、高可用的id生成系统

2、百度 UidGenerator

Github地址:GitHub - baidu/uid-generator: UniqueID generator

3、美团 Leaf

Github地址:GitHub - Meituan-Dianping/Leaf: Distributed ID Generate Service

4、数据库集群模式

采用数据库集群的模式,对数据库自增ID进行扩充。

5、基于数据库的号段模式

为从数据库批量的获取自增ID,每次从数据库取出一个号段范围,例如 [1,1000] 代表1000个ID,具体的业务服务将本号段,等这批号段ID用完,再次向数据库申请新号段。


总结

以上就是常用的分布式全局唯一ID的解决方案,ID编码方式的选择需要根据数据存储空间的大小要求、数据检索效率高低的要求,还有是否易于系统移植的要求去作出选择,每一种编码方式都不完美,我们需要根据自身业务实际情况,去动态地选择调整。

相关推荐

Google Chrome 100 Beta发布 用户代理字符串作用开始逐渐降低

GoogleChrome和MozillaFirefox都在迅速接近100版本,这有可能破坏一些错误识别浏览器版本的网站(可能导致访问不正常,这有点类似于众所周知的千年虫)。两种浏览器都在研究可能的...

如何在Chrome,Edge,Safari和Firefox中更改用户代理

无论您是SEO,营销人员还是Web开发人员,通常都可能需要更改浏览器的用户代理以测试其他内容。例如,您正在运行特定于MAC-OS的活动。要确定您的广告系列是否正常运行并且未针对Linux用户,更改浏览...

Mozilla正在测试新的浏览器UserAgent

Mozilla最近发布了一个实验项目来测试3位数的UserAgent版本“Firefox/100.0”会不会让一些网站停止正常工作。浏览器UserAgent是一串字符串,里面包含了浏览器的软件信息,版...

爬虫与User-Agent

什么是User-Agent呢?User-Agent是一个特殊字符串头,被广泛用来标示浏览器客户端的信息,使得服务器能识别客户机使用的操作系统和版本,CPU类型,浏览器及版本,浏览器的渲染引擎,浏览器...

让你的浏览器充满魔性——User Agent Switche

对于前端人员,闲暇时就会研究各种插件,今天我就分享UserAgentSwitcher在Firefox和Chrome的使用情况。一、Firefox浏览器UserAgentSwitcher作为火...

亚马逊账号运营安全-浏览器指纹识别之User-Agent开篇

UA包含了一个约定的特征字符串。主要是面向受访问网络表明自己的操作系统,软件开发商,版本,应用类型等信息。这是一种主动暴露信息的方式。我们来看关于UA的简单语法定义:User-Agent:<p...

【每日学习】Python爬虫之伪装浏览器User-Agent

【主题】Python爬虫之伪装浏览器原理【分析】1.创建自定义请求对象的目的,对抗网站的反爬虫机制2.反爬虫机制1:判断用户是否是浏览器访问(User-Agent)3.对抗措施1:伪装浏览器进行访问【...

亚马逊账号运营安全-浏览器指纹识别之User-Agent二篇

大家好,上一篇亚马逊账号运营安全-浏览器指纹识别之User-Agent开篇为大家阐述了原理。下面是作者为大家整理的其他几个主流浏览器的UA配置。一下都是Windows1064X系统下整理。Chrom...

常见的爬虫UserAgent

通过前面的文章我们知道,UserAgent(用户代理)是HTTP请求的一部分,用于告诉服务器发起请求的客户端类型和属性等信息。同时,也了解了常见的UserAgent。...

HTTP请求头之User-Agent

什么是User-AgentUser-Agent中文名为用户代理,简称UA,...

你想不到的浏览器流氓史!那些奇怪的User-Agent,是这么来的...

平时我们用chrome浏览器做开发测试。Chrome的Useragent字段怎么这么奇怪?...

谷歌宣布 Chrome 将逐步停止支持 User Agent

谷歌近日宣布将放弃对Chrome浏览器中用户代理字符串(User-AgentString)的支持。取而代之的是,Chrome将提供一个名为“客户端提示(ClientHints)”的新API...

数据采集-用户代理(useragent)

UserAgent分类:PC端的UserAgent。移动端UserAgent。使用UserAgent的必要性:在写python网络爬虫程序的时候,经常需要修改UserAgent,有很多原因,罗列几个如...

如何获取当前浏览器的useragent

有时候,我们需要得到浏览器的useragent,从而再进行后面的一系列判断,返回不同的值。网上有说,在浏览器地址栏输入:javascript:alert(navigator.userAgent)这种方...

User Agent 解析:它是什么以及如何修改

什么是UserAgent?UserAgent,简称UA,是一个使服务器能够识别用户使用的浏览器类型、版本以及运行浏览器的操作系统等信息的字符串。它作为浏览器请求头部信息的一部分发送给服务器,以便服务...

取消回复欢迎 发表评论: