文档章节

聊聊线程技术与线程实现模型

Float_Luuu
 Float_Luuu
发布于 2016/06/10 01:23
字数 2545
阅读 3062
收藏 11

摘要

做多线程应用开发,对于线程的理解是非常重要的,我们要为我们创建的每一个线程负责。这篇文章主要聊聊操作系统线程相关的主题,在了解线程定义、用户态与内核态、模态切换、线程上下文切换的基础之上再对常见的三种线程模型进行进一步介绍,希望对大家能够有所帮助。

 

线程概论

线程定义

什么是线程?《POSIX Threads Programming》中有一段话对线程的定义进行描述:

A thread is defined as an independent stream of instructions that can be scheduled to run as such by the operating system.

线程可以被认为是一个可以被独立调度的实体,这个实体共享进程的地址空间、文件描述符、代码和数据,且拥有自己私有的栈、寄存器上下文、和程序计数器。

为什么要线程

我们在github上面给开源项目提交代码的时候,按照comment格式都要写Motivation这部分,我们今天讨论线程这个存在,也要讨论线程为什么存在。

在很多应用中需要同时执行多个任务,这些任务大部分甚至全部都可以相互独立的并行的执行。比如一个网络代理,传统的实现是用一个进程作为监听器来监听网络端口,当有客户端连接进来的时候,当前进程将会fork一个新的进程来处理客户端的请求。这种体系结构不好的地方如下:

  • fork系统调用对于操作系统来说是一个非常重的操作。
  • 每一个进程都有自己独立的地址空间,进程间相互通信必须要通过标准的IPC技术来实现,比如信号量、共享内存,这些操作是非常昂贵的、严重影响系统性能。

线程的出现就是为了解决这些问题,线程之间拥有共享的进程空间用于共享数据、也有自己独立的运行空间类似一个轻量级的进程。

用户空间与内核空间

在理解用户线程与内核线程之前、我们有必要了解一下用户空间与内核空间。现代操作系统的地址空间主要基于虚拟地址空间机制设计,和实际物理内存大小没关系,比如对于32位操作系统,它的寻址空间为2的32次方也就是4G,这里的寻址空间被称为虚拟存储空间。操作系统的核心是内核,独立于普通应用程序,具有最高权限,可以访问底层硬件设备以及受保护的空间,因此这部分包括驱动程序和操作系统。操作系统的设计者为了保证内核的安全,将用户进程设计为只有一定权限的程序,它不能够操作内核以及硬件。操作系统将虚拟存储空间划分为两部分,一部分是内核空间,一部分是用户空间。针对Linux操作系统而言,最高的1G字节供内核使用,称为内核空间,较低的3G字节供给各个进程使用,被称为用户空间。进程可以通过系统调用进入内核,Linux内核由所有进程共享。用户空间和内核空间示意图如下:

用户空间及内核空间

用户态与内核态

每个进程都拥有所有的虚拟地址空间,当进程运行用户代码的时候是运行在用户地址空间的,这时候CPU运行所需要的指令和数据都保存在用户空间,进程可以认为是指令+数据+CPU,因此这个时候我们把这个状态的进程叫做用户进程。当用户执行系统调用而陷入内核代码中执行的时候,当前进程运行的指令和数据都在内核空间,因此我们把这个状态的进程叫内核进程。用户进程和内核进程不是独立的两个进程的意思,而是进程运行的不同状态。值得注意的是,用户进程不能访问内核虚拟地址空间,内核进程可以访问全部的虚拟地址空间,因此用户进程和内核进程进行数据交换只能通过内核进程从用户地址空间取数据,然后放入用户地址空间。

系统调用涉及到进程从用户态到内核态的切换(mode switch),这个时候涉及到的切换主要是寄存器上下文的切换,和通常所说的进程上下文切换不同,mode switch的消耗相对要小很多。

用户线程与内核线程

上面可以看出,用户线程与内核线程的区别主要在于指令与数据运行于不同虚拟地址空间,用户线程和内核线程也可以叫做用户空间线程和内核空间线程。用户线程由用户代码支持,内核线程由操作系统内核支持。

线程上下文切换

线程上下文切换和线程模态切换不是一个维度的东东,线程上下文切换讲的是多线程之间因为调度器的调度,而从一个线程正在被调度切换到另外一个线程被调度的事情。线程上下文切换必须要保存线程执行的寄存器状态、栈信息、线程正文、数据等,因此相对模态切换是比较重的操作。

线程模型

线程模型在不同的操作系统下的实现通常有三种,每种模型都有其优点与缺点,下面我们来看看这三种线程模型。

用户空间线程模型(M : 1)

一个多线程子系统有可能全部由用户代码实现,这些线程的调度与切换全部发生在用户地址空间,这种模型通常是由一个内核线程和多个用户线程组成。典型的实现是基于POSIX线程draft 4,OSF'DCE是其中一种具体实现。一个用户空间库负责线程的创建、终止、调度与同步。这些线程对于操作系统内核是透明的。

这种模型的好处是线程上下文切换都发生在用户空间,避免的模态切换(mode switch),从而对于性能有积极的影响。然而不好的地方是所有的线程基于一个内核调度实体即内核线程,这意味着只有一个处理器可以被利用,在多处理环境下这是不能够被接受的,本质上,用户线程只解决了并发问题,但是没有解决并行问题。

还有一点,如果线程因为I/O操作陷入了内核态,内核态线程阻塞等待I/O数据,则所有的线程都将会被阻塞,用户空间也可以使用非阻塞而I/O,但是还是有性能及复杂度问题。

用户空间线程模型

内核空间线程模型(1:1)

对于用户空间线程模型,所有的用户线程都和特定的内核线程进行交互,而内核空间线程模型是每个用户线程都和一个特定的内核线程进行交互,用户线程和内核线程是1:1的关系。典型的实现是将每个用户线程映射到一个内核线程上。

每个线程由内核调度器独立的调度,所以如果一个线程阻塞则不影响其他的线程。然而,创建、终止和同步线程都会发生在内核地址空间,这可能会带来较大的性能问题。在创建线程的时候内核必须要进行内存锁的申请,并负责调度线程,而且每个线程都要消耗有限的内核资源,当大量的线程被创建的时候,体现的尤为明显。值得夸奖的是,在多核处理器的硬件的支持下,内核空间线程模型支持了真正的并行,下面是内核空间模型示意图:

内核空间线程模型

内核用户空间线程模型(M : N)

内核用户空间线程模型中,内核线程和用户线程的数量比为M : N,因此也通常被叫做M : N线程模型,内核用户空间综合了前两种的优点。

这种模型需要内核线程调度器和用户空间线程调度器相互操作,本质上是多个线程被绑定到了多个内核线程上,这使得大部分的线程上下文切换都发生在用户空间,而多个内核线程又可以充分利用处理器资源,模型图如下:

内核用户空间线程模型

总结

最近在做jvm线程实现相关研究,发现java线程的问题其实是基于C++和pthread线程库的问题,往下深入,也就是操作系统对于线程实现的问题,这篇文章记录了我对操作系统线程技术的认识和理解。

 

© 著作权归作者所有

Float_Luuu
粉丝 217
博文 47
码字总数 104674
作品 0
长宁
高级程序员
私信 提问
聊聊C10K问题及解决方案

聊聊远程通信 Java远程通讯技术及原理分析 聊聊Socket、TCP/IP、HTTP、FTP及网络编程 RMI原理及实现 RPC原理及实现 轻量级分布式 RPC 框架 使用 RMI + ZooKeeper 实现远程调用框架 深入浅出S...

陶邦仁
2016/04/22
2.5K
1
深入聊聊Java多线程

一、背景   在没有学习Java多线程以前,总觉得多线程是个很神秘的东西,只有那些大神才能驾驭,新年假期没事就来学习和了解一下Java的多线程,本篇博客我们就来从头说一下多线程到底是怎么...

hafiz.zhang
2017/01/29
0
0
聊聊 Spring Boot 2.0 的 WebFlux

聊聊 Spring Boot 2.0 的 WebFlux 泥瓦匠BYSocket2017-11-0416 阅读 Spring技术 聊聊 Spring Boot 2.0 的 WebFlux## 前言 对照下 Spring Web MVC ,Spring Web MVC 是基于 Servlet API 和 Se......

泥瓦匠BYSocket
2017/11/04
0
0
聊聊并发(十四)—基于AQS实现互斥信号(BooleanMutex)

并发系列 聊聊并发(一)深入分析Volatile的实现原理 聊聊并发(二)Java SE1.6中的Synchronized 聊聊并发(三)Java线程池的分析和使用 聊聊并发(四)深入分析ConcurrentHashMap 聊聊并发(...

陶邦仁
2015/11/22
0
1
Java面试必备知识-关于JVM程序计数器

今天跟大家聊聊较为底层的东西。也是作为一个Java开发必备的知识点。JVM虚拟机的结构划分。 相比大家都背的滚瓜烂熟了。JVM虚拟机不就是:程序计数器、栈、堆、方法区吗?这读书的时候都考过...

cnJason
2017/11/06
0
0

没有更多内容

加载失败,请刷新页面

加载更多

构造函数

1:基本概念 提起构造函数,我们需要从JS的创建对象开始,JS的创建对象有两种方式,一种是对象字面量法(把一个对象的属性和方法一一罗列出来),对象字面量法有一个明显的不足在于它不适合批...

凌兮洛
1分钟前
0
0
防抖

export default function debounce(fn, wait) { var timeout; return function() { var ctx = this, args = arguments; clearTimeout(timeout); timeout = setTimeout(funct......

Js_Mei
1分钟前
0
0
RSS 阅读器及源

RSS 阅读器及源 万物皆可 RSS RSS源 1. go2think 2. cnblogs 3. justdojava 4. diyijc

近在咫尺远在天涯
5分钟前
1
0
一文了解金融行业服务治理

转载本文需注明出处:微信公众号EAWorld,违者必究。 引言: 微服务等新技术在解决系统敏捷性的同时,也带来了新的问题,众多的服务被识别出来后需要有效的管理起来,内部系统与外部系统通过...

EAWorld
9分钟前
0
0
Retrofit2应对各种奇葩接口的方法

最近这一年半,实在是大开眼界了,面对各种奇葩的接口,在紧凑的开发周期下,没有时间细想如何去面对,好在最近稍微清闲了,就把遇到的各种奇葩接口整理了一下,自己手写Spring去模拟这些接口...

猴亮屏
20分钟前
0
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部