字节对齐(#pragma pack)

字节对齐(#pragma pack)

字节对齐(#pragma pack)

详解
什么是对齐,为什么要对齐?

现代计算机中内存空间都是按照byte划分的,从理论上讲似乎对任何类型的变量的访问可以从任何地址开始,但实际情况是在访问特定变量的时候经常在特定的内存地址访问,这就需要各类型数据按照一定的规则在空间上排列,而不是顺序的一个接一个的排放,这就是对齐

对齐的作用和原因:各个硬件平台对存储空间的处理有很大的不同。一些平台对某些特定类型的数据只能从特定地址开始存取。但是我们一般不需要关心这个问题,因为编译器对数据存放做了对齐,但是如果我们不了解的话,常常会对一些问题感到迷惑,最常见的就是struct结构体的sizeof的结果,这里介绍一下

对齐方式
程序编译器对结构的存储的特殊处理确实提高CPU存储变量的速度,但是有时候也会带来一些麻烦,我们可以自己设定变量对齐方式

编译器中提供了#pragma pack(n)来设定变量以n字节对齐方式。n字节对齐就是说变量存放的起始地址的偏移量有两种情况:

  1. 如果n大于等于该变量所占用的字节数,那么偏移量必须满足默认的对齐方式
  2. 如果n小于该变量的类型所占用的字节数,那么偏移量为n的倍数,不用满足默认的对齐方式

结构的总大小也有个约束条件,分为下面两种情况:

  1. 如果n大于所有成员变量类型所占用的字节数,那么结构的总大小必须为占用空间最大的变量占用的空间数的倍数
  2. 否则必须为n的倍数

举例:

[code]#include <stdio.h>

#pragma pack(4)

typedef struct test {
char m1;
double m4;
int m3;
} test;

int main(void)
{
test test1;

printf(“%d\n”, sizeof(test1));

return 0;
}
[/code]

以上结构体的大小为16,下面分析一下存储情况:

  1. 首先为m1分配内存空间,其偏移量为0,满足我们自己设定的对齐方式(4字节对齐),m1大小为1byte
  2. 接着为m4分配内存空间,这时其偏移量为4,需要补足3个字节,这样使得偏移量满足4的倍数,m2大小为8byte
  3. 接着为m3分配内存空间,这时其偏移量为12,满足为4的倍数,m3占用4个byte

所以,总共占用的空间为:1+3+8+4 = 16

重要规则:

  1. 复杂类型中各个成员按照它们被声明的顺序在内存中顺序存储,第一个成员的地址和整个类型的地址相同
  2. 每个成员分别对齐,即每个成员按自己的方式对齐,并最小化长度;规则就是每个成员按其数据类型的对齐参数(通常是这个类型的大小)和指定对齐参数中较小的一个对齐
  3. 结构、联合或者类的数据成员,第一个放在偏移量为0的地方;以后每个数据成员的对齐,按照#pragma pack指定的数值和这个数据成员自身长度两个中比较小的那个进行
  4. 复杂类型(如结构体)整体的对齐,是按照结构体中长度最大的数据成员和#pragma pack指定值间较小的那个值进行;这样在成员是复杂类型时,可以最小化长度
  5. 结构整体长度的计算必须取所用过的所有对齐参数的整数倍,不够补字节;也就是取所用过的所有对齐参数中最大的那个值的整数倍,因为对齐参数都是2的n次方

请查看本篇文章的后续:对于字节对齐的二次探究