文档章节

高性能可定制化分布式发号器

liubingsmile
 liubingsmile
发布于 2017/04/05 12:53
字数 1219
阅读 3873
收藏 162

一 什么是分布式发号器

    说起分布式发号器的前生今世,咱们应该感恩这个时代;随着互联网在中国越来越普及化,单机系统或者一个小系统已经无法满足需要,随着用户逐渐增多,数据量越来越大,单个应用或者单个数据库已经无法满足需求,在应用以至于微服务来临,在数据库存储方面分库分表来临,可以解决问题;但是新的问题产生,怎么样做到多个应用可以有唯一主键或者序号,防止数据重复呢?分布式发号器正好为解决这个问题,可以让大家无须为这个问题烦恼了,这是本人写这篇文章初衷!

二  分布式发号器优势

  1. 解决分库分表中唯一序号的问题
  2. 解决分布式应用或者微服务框架中唯一序号的问题
  3. 提供可定制化生成规则,根据业务需求可自定义扩展
  4. 性能高效且系统简单稳定
  5. 系统可任意扩展

三 分布式发号器架构图

    

四 分布式发号器流程图

    1) 分布式发号器重要字段

序号 字段名称 字段类型 描述
concurrentValue 当前值 Integer 当前最新值
step 步长 Integer 每个应用步长不一样, 防止生成重复
maxValue 最大值 Integer 每个应用的最大值
defExpession 自定义表达式 String 自定义生成规则表达式

    2) concurrentValue不存在的流程图

     

    3) concurrentValue存在的流程图

      

 

五 目前存在分布式发号器解决方案

1) UUID

        UUID Universally Unique IDentifier(UUID),有着正儿八经的RFC规范,是一个128bit的数字,也可以表现为32个16进制的字符(每个字符0-F的字符代表4bit),中间用"-"分割。

  •  时间戳+UUID版本号: 分三段占16个字符(60bit+4bit)
  •  Clock Sequence号与保留字段:占4个字符(13bit+3bit)
  • 节点标识:占12个字符(48bit)

2) Hibernate

        Hibernate的CustomVersionOneStrategy.java,解决了之前version 1的两个问题

  • 时间戳(6bytes, 48bit):毫秒级别的,从1970年算起,能撑8925年....
  • 顺序号(2bytes, 16bit, 最大值65535): 没有时间戳过了一毫秒要归零的事,各搞各的,short溢出到了负数就归0。
  • 机器标识(4bytes 32bit): 拿localHost的IP地址,IPV4呢正好4个byte,但如果是IPV6要16个bytes,就只拿前4个byte。
  • 进程标识(4bytes 32bit): 用当前时间戳右移8位再取整数应付,不信两条线程会同时启动。

3) MongoDB

        MongoDB的ObjectId.java

  • 时间戳(4 bytes 32bit):是秒级别的,从1970年算起,能撑136年。
  • 自增序列(3bytes 24bit, 最大值一千六百万): 是一个从随机数开始(机智)的Int不断加一,也没有时间戳过了一秒要归零的事,各搞各的。因为只有3bytes,所以一个4bytes的Int还要截一下后3bytes。
  • 机器标识(3bytes 24bit): 将所有网卡的Mac地址拼在一起做个HashCode,同样一个int还要截一下后3bytes。搞不到网卡就用随机数混过去。
  • 进程标识(2bytes 16bits):从JMX里搞回来到进程号,搞不到就用进程名的hash或者随机数混过去。

    可见,MongoDB的每一个字段设计都比Hibernate的更合理一点,时间戳是秒级别的,自增序列变长了,进程标识变短了。总长度也降到了12 bytes 96bit。

 

4) Twitter的snowflake派号器

       snowflake也是一个派号器,基于Thrift的服务,不过不是用redis简单自增,而是类似UUID version1,只有一个Long 64bit的长度,所以IdWorker紧巴巴的分配成:

  • 时间戳(42bit) :自从2012年以来(比那些从1970年算起的会过日子)的毫秒数,能撑139年。
  • 自增序列(12bit,最大值4096):毫秒之内的自增,过了一毫秒会重新置0。
  • DataCenter ID (5 bit, 最大值32):配置值,支持多机房。
  • Worker ID ( 5 bit, 最大值32),配置值,因为是派号器的id,一个机房里最多32个派号器就够了,还会在ZK里做下注册。

    可见,因为是中央派号器,把至少40bit的节点标识都省出来了,换成10bit的派号器标识。所以整个UID能够只用一个Long表达。

     另外,这种派号器,client每次只能一个ID,不能批量取,所以额外增加的延时是问题,而且只能1024台机器范围之内。

以上几种方案同一个问题,不可自定义,位数过长

 

六) 推荐大神开涛书籍(京东有卖,绝对干货满满,买书送知识)

© 著作权归作者所有

共有 人打赏支持
liubingsmile

liubingsmile

粉丝 114
博文 5
码字总数 6238
作品 7
朝阳
高级程序员
加载中

评论(19)

oreak
oreak
还得依赖redis,不好
繁华似水
繁华似水
不同机器生产的id可以比较大小么??
liubingsmile
liubingsmile

引用来自“loki_lan”的评论

服务本身生成UUID跟分布式发号器生成UUID不是一样吗,前者可以保证不重复,是不是就不需要发号器了呢?
两者方式不一样
liubingsmile
liubingsmile

引用来自“吴建南”的评论

concurrentValue....并发值?
最新值,最近值
吴建南
吴建南
concurrentValue....并发值?
liubingsmile
liubingsmile

引用来自“loki_lan”的评论

服务本身生成UUID跟分布式发号器生成UUID不是一样吗,前者可以保证不重复,是不是就不需要发号器了呢?
先看懂规则,不一样的
loki_lan
loki_lan
服务本身生成UUID跟分布式发号器生成UUID不是一样吗,前者可以保证不重复,是不是就不需要发号器了呢?
天豪-Jason
天豪-Jason
有点深奥,对于我这个小白来说
liubingsmile
liubingsmile

引用来自“刘利民”的评论

不开源吗,让大家也学习一下
源码不开源,不好意思
liubingsmile
liubingsmile

引用来自“刘大神”的评论

引用来自“liubingsmile”的评论

引用来自“刘大神”的评论

引用来自“liubingsmile”的评论

引用来自“刘大神”的评论

引用来自“liubingsmile”的评论

引用来自“刘大神”的评论

这个分布式发号器就只是解决分布式数据库键值重复的问题么?

回复@刘大神 : 不只是,比如券码,提货码等

回复@liubingsmile : 哦哦,那你的键值生成是一种什么样子的策略呢?

回复@刘大神 : 可以自定义配置

回复@liubingsmile : 举个栗子
比如生成规则,需要根据不同的系统生成不一样的规则

回复@liubingsmile : 那如果这个系统同时用到N个系统的时候,生成规则不会出现一丢丢的冲突的可能么?其实,我想知道你具体生成规则是怎么样子的,比如说我现在用的,对本地时间做一些简单的位移运算,这样时间是唯一的,就不会出现重复的情况
你要考虑分布式应用
架构书籍推荐:Java中高级、架构师值得一读!

上周我们免费送出了6本关于Python的重量级技术书籍,推出后反响特别强烈,有一个和最后一名仅差了一个赞,不过我们还是额外加送了一本送给这位朋友,以资鼓励,从另一面也可以看出Java程序猿...

Java技术栈
04/14
0
0
分布式任务执行系统--Gleam-Go

Gleam 是一个高性能和高效的分布式执行系统。纯 Go 编写,可独立运行,也可分布式运行。 高性能 纯 Go 编写的 mapper 和 reducer 具有高性能和并发性 LuaJIT 的性能,可与 C,Java,Go 相媲美...

匿名
2017/03/13
315
0
coconut 更新至 0.0.7.1,应用缓存服务器

coconut 0.0.7.1 发布了。 fasterhttp更新至1.3.0 tcpdaemon更新至1.3.0:支持CPU亲缘性 支持设置IP 优化性能:已连接会话预分配内存 coconut是一款应用缓存服务器,主要用于场景化的缓存服务...

calvinwilliams
2017/06/19
304
0
Netty高性能架构的理解之道

Netty的简单介绍 Netty 是一个 NIO client-server(客户端服务器)框架,使用 Netty 可以快速开发网络应用,例如服务器和客户 端协议。 Netty 提供了一种新的方式来使开发网络应用程序,这种新...

烂猪皮
05/04
0
0
高性能分布式数据存储--MORPHiS

MORPHiS 现在是早期阶段,主要目标是成为一个全局加密分布式存储,为了替代云存储。MORPHiS 现在包含一个 DMAIL(分布式邮件),内置垃圾邮件拦截,内置加密,免费发送信息。 MORPHiS 的使用...

叶秀兰
2015/08/05
3.1K
1

没有更多内容

加载失败,请刷新页面

加载更多

聊聊clean code

clean code,顾名思义就是整洁的代码,或者说清晰、漂亮的代码,相信大多数工程师都希望自己能写出这样的代码。 也许这是个千人千面的话题,每个工程师都有自己的理解。比如我,从一个天天被...

Skqing
32分钟前
3
0
redis连接报错—— (error) NOAUTH Authentication required.

1.redis报认证错误 redis客户端连接成功,但是操作报异常——(error) NOAUTH Authentication required 错误的含义是说你没有认证,说明没有使用密码连接 redis-cli -h 127.0.0.1 -p 6379 -a ...

啊哈关关
38分钟前
3
0
地理位置坐标标准以及转换

/** * 地理位置坐标标准以及转换 * * 1.WGS-84原始坐标系,一般用国际GPS纪录仪记录下来的经纬度,通过GPS定位拿到的原始经纬度,Google和高德地图定位的的经纬度(国外)都是基于W...

葉者
41分钟前
2
0
Generator-ES6

基本概念 Generator 函数是 ES6 提供的一种异步编程解决方案,语法行为与传统函数完全不同。 Generator 函数有多种理解角度。语法上,首先可以把它理解成,Generator 函数是一个状态机,封装...

简心
59分钟前
6
0
FullCalendar日历插件说明文档

普通显示设置 属性 描述 默认值 header 设置日历头部信息。 如果设置为false,则不显示头部信息。包括left,center,right左中右三个位置,每个位置都可以对应以下不同的配置: title: 显示当...

ada_young
今天
1
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部