鸿蒙系统 IO 栈分析 | 解读鸿蒙源码

原创
09/20 00:10
阅读数 4.7W

华为的鸿蒙系统开源之后第一个想看的模块就是 FS 模块,想了解一下它的 IO 路径与 linux 的区别。现在鸿蒙开源的仓库中有两个内核系统,一个是 liteos_a 系统,一个是 liteos_m 系统。两者的区别主要是适应的场景不一样,liteos_a 系统适用于硬件资源更加丰富的场景,比如 CPU 更强,内存更大;而 liteos_m 系统则适用于 IoT 设备,相对来说硬件资源比较弱一些。所以我们就拿 liteos_a 系统来分析一下它的 IO 栈吧,毕竟它应对的场景更加复杂一些。

鸿蒙系统 liteos_a Kernel 的下载地址在这:https://gitee.com/openharmony/kernel_liteos_a。

1.FS 源码结构

下载内核源码后发现 fs 目录下似乎缺少很多东西。

当时觉得好奇怪,啥都没有,那它的 shell 相关命令是怎么使用 fs 模块进行读写的呢?于是发现鸿蒙的 FS 模块主要是从 Nuttx (注:Nuttx 是 Apache 正在孵化的实时操作系统内核)那里借用了 FS 的相关实现。这是从内核的 fs.h 引用的路径发现的,它引用的路径内容如下:

../../../../../third_party/NuttX/include/nuttx/fs/fs.h

所以我们需要找到这个模块,在 gitee 的仓库中搜索 Nuttx 发现的确有这个仓库,所以我们需要联合两个仓库的代码一起解读 IO 栈的源码。Nuttx 的仓库地址为:https://gitee.com/openharmony/third_party_NuttX。

我们来看一下 Nuttx 的目录结构:

可以发现 FS 的具体实现都在这个 Nuttx 仓库内。接下来我们来看看鸿蒙系统的 IO 栈吧,因为 IO 栈的路径比较多,所以我们选取块设备(block device)的路径来分析。

2. IO 整体架构

鸿蒙系统关于块设备的 IO 栈路径整体架构如下图所示:

整体 IO 流程如下:

  1. 上层应用会在用户态下调用 read / write 接口,这会触发系统调用(syscall)进入内核态;
  2. 系统调用往下调用 VFS 的接口,如 read 则对应 read,write 对应 write;
  3. VFS 这层会根据 fd 对应的 file 结构拿出超级块的 inode,利用这个 inode 继续往下调用具体 driver 的 read / write 接口;
  4. 在块设备的场景下,它是利用字符设备的驱动作为它的代理,也就是 driver 下面的 bch。鸿蒙系统的设备驱动中并没有块设备的驱动,所以它做了一层 block_proxy,无论是字符设备还是块设备的 IO 都会经过 bch 驱动。数据所位于的扇区以及偏移量(offset)计算位于这层;
  5. IO 往下走会有一层缓存,叫 bcache。bcache 采用红黑树管理这些缓存的数据;
  6. IO 再往下走就是块设备的驱动,内核没有通用的块设备驱动实现,它应该是由不同的厂商来实现的。

3.鸿蒙 IO 流程源码解读

读写流程大致一样,我们就看一下鸿蒙的读数据流程吧。由于函数的源码比较长,全贴出来也不太好,所以太长的源码我只将关键的部分截出。

3.1 上层应用读取数据

上层应用调用 read 接口,这个是系统的 POSIX 接口,read 接口原型如下:

#include <unistd.h>
ssize_t read(int fd, void *buf, size_t count); 

3.2 VFS

上层应用在用户态调用 read 接口后会触发系统调用,这个系统调用在 Kernel 的如下文件中进行注册:

syscall/fs_syscall.c

对应的系统调用函数为

237 行的 read 调用的是 VFS 这层的 read,VFS 这层的 read 函数实现位于 Nuttx 项目的如下路径:

fs/vfs/fs_read.c

read函数从 fd (文件描述符)中获取对应的 file 对象指针,然后在调用 file_read 接口。file_read 也和 read 函数位于同一个文件下。它从 file 对象中获取了超级块的 inode 对象,然后使用这个 inode 调用 bch 驱动的 read 函数。

3.3 bch 驱动

bch 驱动是一个字符设备驱动,它被用来当做上层与块设备驱动的中间层。注册块设备驱动时会调用 block_proxy 来做代理转换,它的实现位于:

fs/driver/fs_blockproxy.c

当打开(open)一个块设备时,内核会判断 inode 是否是块设备类型,如果是则调用 block_proxy 来做转换处理。 当上层调用 u.i_ops->read 时,它对应的是 bch_read,它的实现位于:

drivers/bch/bchdev_driver.c

bch_read 会接着调用 bchlib_read,这个函数的实现位于:

drivers/bch/bchlib_read.c

它会根据偏移(offset)计算出在哪个扇区进行读数据,如果要读取的数据只是某个扇区的一部分,则它会先利用 bchlib_readsector 将这个扇区全部读出来,然后再把对应的那部分数据拷贝到内存并返回。 bchlib_readsector 的实现位于如下位置:

drivers/bch/bchlib_cache.c

它会先将位于内存的脏数据下刷,等脏数据都下刷完成后才会利用 los_disk_read 把数据从磁盘上读上来。 los_disk_read 的实现位于 kernel 的如下位置:

fs/vfs/disk/disk.c

这 los_disk_read 这层会有一层缓存,叫 bcache。它会把每次 IO 的扇区缓存到内存中,缓存的组织方式为红黑树。它是有大小限制的,不是无限增长,具体大小与内存大小有关。 los_disk_read 在读数据之前会先从 bcache 缓存中查找有没有对应的缓存扇区,如果有则直接将这个扇区返回,如果没有则调用真正块设备的 read 函数。这个 read 函数在内核中没有对应的实现,所以它是跟随每个块设备的驱动的不同而不同。

整个读数据流程源码分析就到这里。

鸿蒙系统的 IO 栈分支比较多,这次的源码解读选用了块设备的分支进行分析,希望可以帮助大家更好的理解鸿蒙系统。最后我还想做一下鸿蒙系统与 Linux 关于 IO 栈的对比。

4.鸿蒙 IO 栈与 Linux IO 栈的对比

如果有研究过 linux IO 栈的同学应该能体会到鸿蒙的 IO 栈是比较简单。先来看一下 Linux 的 IO 栈整体架构图:

所以,我们对比一下鸿蒙系统和 Linux IO 栈的主要区别吧:

  1. 鸿蒙没有 pagecache。所以鸿蒙的系统调用加不加 O_SYNC 应该是一样的,都是直接下到磁盘。
  2. 鸿蒙没有通用块层和 IO 调度层。在 Linux 中通用块层是用来将连续的块请求组成一个 bio 结构体,便于对接下层的调度管理。调度层的目的则是用来减少 IO 寻址时间,在这层也有多种调度算法可以选择,如 cfq/deadline/noop 等。我觉得鸿蒙不是没有这两层,而是还没有做,目前只是 IoT 的适用场景。等明年适用于手机的时候再看看,我觉得应该也会做相关的处理,只不过不一定与 Linux 的处理一样。
  3. 鸿蒙的驱动层次不够完整,需要用字符设备的驱动来代理块设备的驱动,不知道这是基于什么考虑。
  4. 鸿蒙 bcache 的作用与 linux 的 pagecache 作用基本一致,只不过它们在 IO 栈上所在的位置不一样。

本文参与了「解读鸿蒙源码」技术征文,欢迎正在阅读的你也加入。

展开阅读全文
打赏
13
31 收藏
分享
加载中
感觉并没有新东西
09/22 15:38
回复
举报
源码好像访问不了!大家能访问吗?
09/21 22:21
回复
举报
GongMingWei博主
可以的。那个 url 连着一个句号,直接点过去是有问题的。
09/22 10:24
回复
举报
操作系统是和硬件紧密相连的,系统核心就是些进程管理、文件系统、内存管理,如果没有完全国产化的芯片、硬盘和内存,现在就不要瞎谈所谓的完全自主化的操作系统,没有意义,自主可控就ok了!!!
09/21 17:56
回复
举报
佳作
09/21 17:26
回复
举报
用的编辑器是vs code。。。。。
09/21 13:08
回复
举报
VS code是目前最优秀的编辑器啊,不信你打开一个10M以上的文本文件比比就知道了
09/21 13:41
回复
举报
不需要,从 vs code 出bate版本,就开始用了。。
09/21 13:51
回复
举报
目测目前火不了,生态有很长的路
09/21 10:41
回复
举报
拿国外的东西,拆拆捡捡就是完全自主的了,帅气
09/21 10:02
回复
举报
哦,没你厉害,只会动动嘴!
09/21 10:08
回复
举报
但我也不会吹这个牛哈
09/21 10:10
回复
举报
你懂啥
09/28 09:23
回复
举报
你又知别人是拆拆捡捡?有LINUX的影子,不代表是抄,因为一开始研究的系统是LINUX,可能支受他影响写的代码导致你认为他是抄?
09/21 11:35
回复
举报
你搭理这些人做什么,他们眼里抄袭施乐GUI创意,使用FreeBSD内核的iOS,同样基于ARM架构CPU的苹果都是原创,到了华为就是拆拆捡捡
09/21 13:45
回复
举报
这是人家外国人的知识产权,现在不给用了,人家外国人内部随意抄,这是他们家的,不然哪来的完全自主
09/21 13:58
回复
举报
你眼中只有中国和外国???
09/21 14:19
回复
举报
首先,你先搞清楚是美国还是外国,如果是外国的都不能用,那么凭什么?很多中国的知识产权,外国人不也是在用?你有本事让外国人别用青蒿素,别用中国的疫苗 其次,谁又没尊重他们的知识产权?你去看清楚LINUX的版权协议再说,OK?
09/21 15:07
回复
举报
知识产权是有合理的时间空间边界的,不要把自己套死在狭小的时空里,站在前人的肩膀上如果能做的比别人还性能好有特色那就是你的厉害之处!关键你如果连别人的肩膀都站不上去,只能在山脚下瞎bb,那就是只井底之蛙!!!
09/21 17:49
回复
举报
你要重复造轮子?
09/21 11:57
回复
举报
知识产权是人家外国人的,这不是米国佬不给用了吗,不然谈什么完全自主
09/21 13:55
回复
举报
其实,你有没有鉴定过里面的代码是不是抄啊,你确定不是华为的人敲出来的?
09/21 14:33
回复
举报
别跪了,站立吧孩纸
09/21 16:36
回复
举报
照你这么说,苹果也是参考unix、linux、bsd拆拆捡捡起来的,怎么说?
09/21 17:43
回复
举报
可能你祖上某一辈或几辈就和外zu通婚了,那你也是拆拆捡捡来的,不是完全你本zu,真是“帅气”😂
09/21 18:08
回复
举报
男儿当自强,而非傻傻自黑
09/22 07:37
回复
举报
知道下贱是什么意思吗?自己照照镜子就知道了
09/24 08:57
回复
举报
部分抄袭是可以的,30%自主已经很了不得了!大部分(70%以上)都照抄的行为,确实不咋地!
09/28 09:26
回复
举报
您好,请问这个系统是基于linux还是全部自主研发的?
09/21 09:38
回复
举报
好文章
09/21 08:36
回复
举报
都知道怎么回事.加油吧.
09/20 23:59
回复
举报
更多评论
打赏
44 评论
31 收藏
13
分享
返回顶部
顶部