很多人对结构体对齐有误解

2021/09/12 20:24
阅读数 263

正文

大家好,我是bug菌!

最近看到一些朋友在交流结构体对齐方面的一些问题,从他们的交谈中隐隐约感觉有几个朋友对结构体成员的对齐理解上有点偏差,不能说完全不对吧,毕竟这是老生常谈的问题了~

所以bug菌今天跟大家好好谈谈对齐这个话题~

1

变量与内存

首先我们要明确,在嵌入式 C 语言中变量是什么?其实所谓的 变量就是一小段内存。

当你随心所欲的在C程序中定义着各种变量,有没有想过他们是如何被安排到相应内存上的?

好吧,其实他们是怎么安排的,并不需要程序员太多的操心,这个映射过程都是编译器自动给大家分配的,(可以借助动态内存的角度去看待这个分配问题),因为大部分变量在一定内存区域上是可以任意选择地址的,比如你定义一个全局的int gVar 变量,在不进行特殊指定内存位置的情况下,其编译后所分配的内存地址并不一定每次都是相同的;当然,每次编译完成便会确定下来,并且程序中对该变量的访问,均会使用所确定下来的内存地址。

既然变量的地址分配过程由编译器自动完成,但有时候我们想把一些或者某个变量放在固定的内存地址处等,此时就需要通过一些语法来告诉编译器该如何分配这些指定变量内存的分配,比如要做复位数据恢复等。

然而内存的对齐问题也是对这些变量分配位置处理的一种方式,通常我们看到的align或者pack等就是来干预编译器的这块处理的。

2

结构体对齐

理解了上面的一个思路,那么我们来分析分析结构体对齐问题。
参考demo:
 1#include <stdio.h>
2#include <stdlib.h>
3
4/*默认对齐方式*/ 
5typedef struct _tag_ContrlObj1
6{
7    char member1;
8    int member2;
9
10}sContrl1;
11
12/*1字节对齐*/ 
13#pragma pack(1
14typedef struct _tag_ContrlObj2
15{
16    char member1;
17    int member2;
18
19}sContrl2;
20#pragma pack()
21
22/*2字节对齐*/ 
23#pragma pack(2)
24typedef struct _tag_ContrlObj3
25{
26    char member1;
27    int member2;
28
29}sContrl3;
30#pragma pack()
31
32/*4字节对齐*/ 
33#pragma pack(4)
34typedef struct _tag_ContrlObj4
35{
36    char member1;
37    int member2;
38
39}sContrl4;
40#pragma pack()
41
42/*8字节对齐*/  
43#pragma pack(8)
44typedef struct _tag_ContrlObj5
45{
46    char member1;
47    int member2;
48
49}sContrl5;
50#pragma pack()
51
52int main(int argc, char *argv[]) {
53
54    printf("default:%d\n",sizeof(sContrl1));
55    printf("pack(1):%d\n",sizeof(sContrl2)); 
56    printf("pack(2):%d\n",sizeof(sContrl3));
57    printf("pack(4):%d\n",sizeof(sContrl4));
58    printf("pack(5):%d\n",sizeof(sContrl5));
59
60    return 0;
61}
运行结果:

以上编译结果采用的是32位编译器,默认对齐方式是4个字节,char类型占据1个字节,int占据4个字节,下面简单分析一下结果:
1、默认方式,采用4个字节对齐,那么char后面需要填充3个字节,然后存放int类型,所以结构体大小输出为8。
2、1字节对齐方式,直接紧凑排列,很多人也叫不进行对齐处理,所以输出结果是5。
3、2字节对齐方式,其实和4个字节对齐是类似的,char按照2字节对齐,所以后面需要填充一个字节,这样int才能以两字节对齐排布,此时整个结构体占据6个字节。
4、4字节对齐方式与默认对齐方式一致,最后看看8字节对齐,此时char类型与int类型完全能够被8个字节容纳,而该结构体最大数据类型是4个字节,所以char后面会预留3个字节,进行4字节对齐,然后放置int类型,此时与4字节对齐是一致的。
那么一些朋友会问,是不是在上面的8字节例子中再加入一个char类型的成员,整个结构体就会占据16个字节了呢?

1/*8字节对齐*/  
2#pragma pack(8)
3typedef struct _tag_ContrlObj5
4{
5    char  member1;
6    int   member2;
7    char  member3;
8}sContrl5;
9#pragma pack()

其输出结果如下:
结构体所占据的字节是12个,那是不是认为8字节对齐没有意义呢?
我们再看一个实验:

1/*8字节对齐*/  
2#pragma pack(8)
3typedef struct _tag_ContrlObj5
4{
5    char     member1;
6    double   member2;
7    char     member3;
8}sContrl5;
9#pragma pack()

此时double占据了8个字节,按照前面的思路应该是4+8+4,应该最终结构体的大小是16个字节,而结果显示:
输出结果显示24=8+8+8的形式,大家也可以直接采用打印结构体成员地址的办法查看是几个字节对齐,有点晕,到底编译器这一块是怎么处理的呢?
结论是:对齐字节数 = min< 当前 指定的pack值,最大成员所占字节 大小 >。

很多朋友其实研究到这个阶段基本上就没有再继续探究了~嵌入式C语言一定要跟硬件结合理解~

3

内存对齐

其实所谓的结构体对齐,并不是简单的1个字节、两个字节等多个字节的排列组合,而是在对应对齐地址上分布。
首先对齐需要解决的问题是什么 ? 即为啥需要对齐?
提高内存的访问效率 ,也可以说是受CPU等硬件方面的限制,按照特定的对齐地址进行数据的访问要快于跨非对齐地址的内存访问;并且有些平台仅支持对齐方式访问,非对齐方式会直接运行错误。
为了加快相关数据的正确访问,编译器会把相关的变量尽量的放到对齐的地址上,也就是默认的对齐方式,比如CPU在偶数地址上访问比较快,那么就会采用2个字节对齐的方式。
所以结构体内部成员并不是简单成员字节个数的对齐拼凑,而是让结构体成员落在对齐的地址上以便访问。如下图所示,当进行2字节对齐,如果只是简单的拼凑,两种分布都是可以的,但是左侧才是正确的2字节对齐方式,char成员变量的地址是2,int变量的地址是4,均为2字节的倍数。


总结一下: 结构体对齐不再是简单的字节个数的拼凑,而是要与内存地址进行挂钩~一般我们也可以理解为内存地址分配是多少字节的倍数,就是多少直接对齐~
enjoy~

最后

    今天的内容就到这里了,觉得有所收获,记得点个 哦~~

本文分享自微信公众号 - 嵌入式客栈(embInn)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。

展开阅读全文
加载中
点击引领话题📣 发布并加入讨论🔥
打赏
0 评论
0 收藏
0
分享
返回顶部
顶部