线程池源码解析系列:为什么要使用位运算表示线程池状态

原创
2021/05/26 13:01
阅读数 3.8K

欢迎大家关注公众号「JAVA前线」查看更多精彩分享文章,主要包括源码分析、实际应用、架构思维、职场分享、产品思考等等,同时欢迎大家加我个人微信「java_front」一起交流学习

0 文章概述

我们阅读ThreadPoolExecutor源码时在开篇就会发现很多位运算代码:

public class ThreadPoolExecutor extends AbstractExecutorService {
    private final AtomicInteger ctl = new AtomicInteger(ctlOf(RUNNING, 0));
    private static final int COUNT_BITS = Integer.SIZE - 3;
    private static final int CAPACITY   = (1 << COUNT_BITS) - 1;

    private static final int RUNNING    = -1 << COUNT_BITS;
    private static final int SHUTDOWN   =  0 << COUNT_BITS;
    private static final int STOP       =  1 << COUNT_BITS;
    private static final int TIDYING    =  2 << COUNT_BITS;
    private static final int TERMINATED =  3 << COUNT_BITS;

    private static int runStateOf(int c)     return c & ~CAPACITY; }
    private static int workerCountOf(int c)  return c & CAPACITY; }
    private static int ctlOf(int rs, int wc) return rs | wc; }
}

不难发现线程状态都用位运算表示,但是为什么要这样做呢?为什么不定义为直观的数字呢?下面我们进行分析。虽然代码量不多,但是想要理解线程池就必须要理解为什么使用位运算。

ThreadPoolExecutor在设计时就是用一个int数值表示了两个业务含义:线程池状态和线程数量。其中高3位表示线程池状态,低29位表示线程数量,这个设计思想体现在以下三句代码:

// 代码1
private final AtomicInteger ctl = new AtomicInteger(ctlOf(RUNNING, 0));
// 代码2
private static final int COUNT_BITS = Integer.SIZE - 3;
// 代码3
private static final int CAPACITY   = (1 << COUNT_BITS) - 1;

代码1表示用一个int保存线程池信息,代码2表示一共有(32-3)=29位可以表示线程数量,代码3表示理论上最大线程数量为536870911,这个理论值足以支撑线程池使用。

 

1 线程池状态

我们明白了线程池上述设计思想,下面就来分析线程池状态值:

private static final int RUNNING    = -1 << COUNT_BITS;
private static final int SHUTDOWN   =  0 << COUNT_BITS;
private static final int STOP       =  1 << COUNT_BITS;
private static final int TIDYING    =  2 << COUNT_BITS;
private static final int TERMINATED =  3 << COUNT_BITS;

我们知道COUNT_BITS=29则上述代码等价于:

private static final int RUNNING    = -1 << 29;
private static final int SHUTDOWN   =  0 << 29;
private static final int STOP       =  1 << 29;
private static final int TIDYING    =  2 << 29;
private static final int TERMINATED =  3 << 29;

现在我们算一算这些状态等于多少,在这里我们从后往前算,因为RUNNING状态是负数左移运算,计算步骤稍微多一些。

(1) TERMINATED = 3 << 29

初始值:00000000 00000000 00000000 00000011
左移后:01100000 00000000 00000000 00000000

(2) TIDYING = 2 << 29

初始值:00000000 00000000 00000000 00000010
左移后:01000000 00000000 00000000 00000000

(3) STOP = 1 << 29

初始值:00000000 00000000 00000000 00000001
左移后:00100000 00000000 00000000 00000000

(4) SHUTDOWN = 0 << 29

初始值:00000000 00000000 00000000 00000000
左移后:00000000 00000000 00000000 00000000

(5) RUNNING = -1 << 29

原码:10000000 00000000 00000000 00000001
反码:11111111 11111111 11111111 11111110(原码符号位不变、数值位取反)
补码:11111111 11111111 11111111 11111111(反码+1)
左移:11100000 00000000 00000000 00000000

 

2 位运算应用

runStateOf方法用来获取线程池状态信息,workerCountOf方法用来获取线程池线程数,ctlOf方法用来设置当前线程池状态和线程数量信息,我们分别进行计算。

private static int runStateOf(int c)     return c & ~CAPACITY; }
private static int workerCountOf(int c)  return c & CAPACITY; }
private static int ctlOf(int rs, int wc) return rs | wc; }

(1) CAPACITY = (1 << 29) - 1

先左移:00100000 00000000 00000000 00000000
再减一:00011111 11111111 11111111 11111111

(2) ~CAPACITY

原始值:00011111 11111111 11111111 11111111
取反后:11100000 00000000 00000000 00000000

(3) runStateOf

现在一个线程池状态是RUNNING并且线程数量等于3用二进制表示如下:

11100000 00000000 00000000 00000011

执行runStateOf方法就可以得到线程池状态:

11100000 00000000 00000000 00000011
&
11100000 00000000 00000000 00000000
=
11100000 00000000 00000000 00000000

(4) workerCountOf

现在一个线程池状态是RUNNING并且线程数量等于4用二进制表示如下:

11100000 00000000 00000000 00000100

执行workerCountOf方法就可以得到线程数量:

11100000 00000000 00000000 00000100
&
00011111 11111111 11111111 11111111
=
00000000 00000000 00000000 00000100

(5) ctlOf

现在我们要设置一个状态是RUNNING且线程数量等于4的线程池ctl值:

private final AtomicInteger ctl = new AtomicInteger(ctlOf(RUNNING, 4));

11100000 00000000 00000000 00000000
|
00000000 00000000 00000000 00000100
=
11100000 00000000 00000000 00000100

这个方法真正体现了高3位表示线程池状态,低29位表示线程数量这个设计思想优点,原本需要两步设置动作现在只需要一步,从而实现了操作原子性,这样就可以满足线程池的很多CAS操作,例如线程池在调用addWorker新增工作线程数时会调用compareAndIncrementWorkerCount方法增加线程数量。

但是假设同一时刻shutdownNow方法导致线程池状态发生改变,那么新增工作线程数方法就不会调用成功,需要继续执行自旋进行尝试,这体现了线程状态和线程数量维护的原子性。
 

3 位图法应用

3.1 需求背景

我们看看位运算怎样应用在实际开发场景。假设在系统中用户一共有三种角色:普通用户、管理员、超级管理员,现在需要设计一张用户角色表记录这类信息。我们不难设计出如下方案:

线程池源码解析系列:为什么要使用位运算表示线程池状态

 

我们使用1表示是,0表示否,那么观察上表不难得出,用户一有用超级管理员角色,用户二具有管理员角色,用户三具有普通用户角色,用户四同时具有三种角色。如果此时新增加一种角色呢?那么新增一个字段即可。

3.2 发现问题

按照上述一个字段表示一种角色进行表设计功能上是没有问题的,优点是容易理解结构清晰,但是我们想一想有没有什么问题?笔者遇到过如下问题:在复杂业务环境一份数据可能会使用在不同的场景,例如上述数据存储在MySQL数据库,这一份数据还会被用在如下场景:

检索数据需要同步一份到ES

业务方使用此表通过Flink计算业务指标

业务方订阅此表Binlog消息进行业务处理

如果表结构发生变化,数据源之间就要重新进行对接,业务方也要进行代码修改,这样开发成本比较非常高。有没有办法避免此类问题?

3.3 解决方案

我们可以使用位图法,这样同一个字段可以表示多个业务含义。首先设计如下数据表,userFlag字段暂时不填。

线程池源码解析系列:为什么要使用位运算表示线程池状态

 

我们设计位图每一个bit表示一种角色:

线程池源码解析系列:为什么要使用位运算表示线程池状态

 

我们使用位图法表示如下数据表:

线程池源码解析系列:为什么要使用位运算表示线程池状态

 

用户一位图如下十进制数值等于4:

线程池源码解析系列:为什么要使用位运算表示线程池状态

 

用户二位图如下十进制数值等于2:

线程池源码解析系列:为什么要使用位运算表示线程池状态

 

用户三位图如下十进制数值等于1:

线程池源码解析系列:为什么要使用位运算表示线程池状态

 

用户四位图如下十进制数值等于7:

线程池源码解析系列:为什么要使用位运算表示线程池状态

 

现在我们可以填写数据表第三列:

线程池源码解析系列:为什么要使用位运算表示线程池状态

 

3.4 代码实例

(1) 枚举定义

定义枚举时不要直接定义为1、2、4这类数字,而是采用位移方式进行定义,这样使用者可以明白设计者的意图。

/**
 * 用户角色枚举
 *
 * @author 微信公众号「JAVA前线」
 *
 */
public enum UserRoleEnum {

    // 1 -> 00000001
    NORMAL(1"普通用户"),

    // 2 -> 00000010
    MANAGER(1 << 1"管理员"),

    // 4 -> 00000100
    SUPER(1 << 2"超级管理员")

    ;

    private int code;
    private String description;

    private UserRoleEnum(Integer code, String description) {
        this.code = code;
        this.description = description;
    }

    public String getDescription() {
        return description;
    }

    public int getCode() {
        return this.code;
    }
}

假设用户已经具有普通用户角色,我们需要为其增加管理员角色,这就是新增角色,与之对应还有删除角色和查询角色,这些操作需要用到为位运算,详见代码注释。

/**
 * 用户角色枚举
 *
 * @author 微信公众号「JAVA前线」
 *
 */
public enum UserRoleEnum {

    // 1 -> 00000001
    NORMAL(1"普通用户"),

    // 2 -> 00000010
    MANAGER(1 << 1"管理员"),

    // 4 -> 00000100
    SUPER(1 << 2"超级管理员")

    ;

    // 新增角色 -> 位或操作
    // oldRole -> 00000001 -> 普通用户
    // addRole -> 00000010 -> 新增管理员
    // newRole -> 00000011 -> 普通用户和管理员
    public static Integer addRole(Integer oldRole, Integer addRole) {
        return oldRole | addRole;
    }

    // 删除角色 -> 位异或操作
    // oldRole -> 00000011 -> 普通用户和管理员
    // delRole -> 00000010 -> 删除管理员
    // newRole -> 00000001 -> 普通用户
    public static Integer removeRole(Integer oldRole, Integer delRole) {
        return oldRole ^ delRole;
    }

    // 是否有某种角色 -> 位与操作
    // allRole -> 00000011 -> 普通用户和管理员
    // qryRole -> 00000001 -> 是否有管理员角色
    // resRole -> 00000001 -> 有普通用户角色
    public static boolean hasRole(Integer allRole, Integer qryRole) {
        return qryRole == (role & qryRole);
    }

    private int code;
    private String description;

    private UserRoleEnum(Integer code, String description) {
        this.code = code;
        this.description = description;
    }

    public String getDescription() {
        return description;
    }

    public int getCode() {
        return this.code;
    }

    public static void main(String[] args) {
        System.out.println(addRole(12));
        System.out.println(removeRole(31));
        System.out.println(hasRole(31));
    }
}

(2) 数据查询

假设在运营后台查询界面中,需要查询具有普通用户角色的用户数据,可以使用如下SQL语句:

select * from user_role where (user_flag & 1) = user_flag;
select * from user_role where (user_flag & b'0001') = user_flag;

我们也可以使用如下MyBatis语句:

<select id="selectByUserRole" resultMap="BaseResultMap" parameterType="java.util.Map">
  select * from user_role 
  where user_flag & #{userFlag} = #{userFlag}
</select>

<select id="selectByUserIdAndRole" resultMap="BaseResultMap" parameterType="java.util.Map">
  select * from user_role 
  where id = #{userId} and user_flag & #{userFlag} = #{userFlag}
</select>

 

4 文章总结

本文首先分析了位运算在Java线程池源码的应用,然后我们又介绍了位图法,这样一个字段就可以表示多个含义,从而减少了字段冗余,节省了对接和开发的成本。当然位图法也有缺点,例如数据库字段含义不直观需要进行转义,增加了代码理解成本,大家可以根据需求场景选择使用,希望本文对大家有所帮助。

欢迎大家关注公众号「JAVA前线」查看更多精彩分享文章,主要包括源码分析、实际应用、架构思维、职场分享、产品思考等等,同时欢迎大家加我个人微信「java_front」一起交流学习

展开阅读全文
加载中

作者的其它热门文章

打赏
0
8 收藏
分享
打赏
0 评论
8 收藏
0
分享
返回顶部
顶部