一、什么是字節(jié)對齊
計算機(jī)中內(nèi)存空間都是按照byte劃分的,從理論上講似乎對任何類型的變量的訪問可以從任何地址開始,但實際情況是在訪問特定類型變量的時候經(jīng)常在特定的內(nèi)存地址訪問,這就需要各種類型數(shù)據(jù)按照一定的規(guī)則在空間上排列,而不是順序的一個接一個的排放,這就是對齊。
二、對齊的作用和原因:
1、平臺原因(移植原因):不是所有的硬件平臺都能訪問任意地址上的任意數(shù)據(jù)的;某些硬件平臺只能在某些地址處取某些特定類型的數(shù)據(jù),否則拋出硬件異常。各個硬件平臺對存儲空間的處理上有很大的不同。一些平臺對某些特定類型的數(shù)據(jù)只能從某些特定地址開始存取。比如有些架構(gòu)的CPU在訪問一個沒有進(jìn)行對齊的變量的時候會發(fā)生錯誤,那么在這種架構(gòu)下編程必須保證字節(jié)對齊。
2、性能原因:最常見的是如果不按照適合其平臺要求對數(shù)據(jù)存放進(jìn)行對齊,會在存取效率上帶來損失。數(shù)據(jù)結(jié)構(gòu)(尤其是棧)應(yīng)該盡可能地在自然邊界上對齊。原因在于,為了訪問未對齊的內(nèi)存,處理器需要作兩次內(nèi)存訪問,而對齊的內(nèi)存訪問僅需要一次訪問。比如有些平臺每次讀都是從偶地址開始,如果一個int型(假設(shè)為32位系統(tǒng))如果存放在偶地址開始的地方,那么一個讀周期就可以讀出這32bit,而如果存放在奇地址開始的地方,就需要2個讀周期,并對兩次讀出的結(jié)果的高低字節(jié)進(jìn)行拼湊才能得到該32bit數(shù)據(jù)。顯然在讀取效率上下降很多。
三、對齊規(guī)則
每個特定平臺上的編譯器都有自己的默認(rèn)“對齊系數(shù)”(也叫對齊模數(shù))。程序員可以通過預(yù)編譯命令#pragma pack(n),n=1,2,4,8,16 來改變這一系數(shù),其中的n就是你要指定的“對齊系數(shù)”。
規(guī)則:
1、數(shù)據(jù)成員對齊規(guī)則:結(jié)構(gòu)(struct)(或聯(lián)合(union))的數(shù)據(jù)成員,第一個數(shù)據(jù)成員放在offset為0的地方,以后每個數(shù)據(jù)成員的對齊 按照#pragma pack指定的數(shù)值和這個數(shù)據(jù)成員自身長度中,比較小的那個進(jìn)行。
2、結(jié)構(gòu)(或聯(lián)合)的整體對齊規(guī)則:在數(shù)據(jù)成員完成各自對齊之后,結(jié)構(gòu)(或聯(lián)合)本身也要進(jìn)行對齊,對齊將按照#pragma pack指定的 數(shù)值和結(jié)構(gòu)(或聯(lián)合)最大數(shù)據(jù)成員長度中,比較小的那個進(jìn)行。
3、當(dāng)#pragma pack的n值等于或超過所有數(shù)據(jù)成員長度的時候,這個n值的大小將不產(chǎn)生任何效果。
四、請看下面的結(jié)構(gòu):
struct MyStruct
{
double dda1;
char dda;
int type
};
對結(jié)構(gòu)MyStruct采用sizeof會出現(xiàn)什么結(jié)果呢?sizeof(MyStruct)為多少呢?也許你會這樣求: sizeof(MyStruct)=sizeof(double)+sizeof(char)+sizeof(int)=13
但是當(dāng)在VC中測試上面結(jié)構(gòu)的大小時,你會發(fā)現(xiàn)sizeof(MyStruct)為16。你知道為什么在VC中會得出這樣一個結(jié)果嗎?
其實,這是VC對變量存儲的一個特殊處理。為了提高CPU的存儲速度,VC對一些變量的起始地址做了“對齊”處理。在默認(rèn)情況下,VC規(guī)定各成員變量存放的起始地址相對于結(jié)構(gòu)的起始地址的偏移量必須為該變量的類型所占用的字節(jié)數(shù)的倍數(shù)。下面列出常用類型的對齊方式(vc6.0,32位系統(tǒng))。
類型對齊方式(變量存放的起始地址相對于結(jié)構(gòu)的起始地址的偏移量)
Char偏移量必須為sizeof(char)即1的倍數(shù)
int 偏移量必須為sizeof(int)即4的倍數(shù)
float 偏移量必須為sizeof(float)即4的倍數(shù)
double偏移量必須為sizeof(double)即8的倍數(shù)
Short 偏移量必須為sizeof(short)即2的倍數(shù)
各成員變量在存放的時候根據(jù)在結(jié)構(gòu)中出現(xiàn)的順序依次申請空間,同時按照上面的對齊方式調(diào)整位置,空缺的字節(jié)VC會自動填充。同時VC為了確保結(jié)構(gòu)的大小為結(jié)構(gòu)的字節(jié)邊界數(shù)(即該結(jié)構(gòu)中占用最大空間的類型所占用的字節(jié)數(shù))的倍數(shù),所以在為最后一個成員變量申請空間后,還會根據(jù)需要自動填充空缺的字節(jié)。
下面用前面的例子來說明VC到底怎么樣來存放結(jié)構(gòu)的。
struct MyStruct
{
double dda1;
char dda;
int type
};
為上面的結(jié)構(gòu)分配空間的時候,VC根據(jù)成員變量出現(xiàn)的順序和對齊方式,先為第一個成員dda1分配空間,其起始地址跟結(jié)構(gòu)的起始地址相同(剛好偏移量0剛好為sizeof(double)的倍數(shù)),該成員變量占用sizeof(double)=8個字節(jié);接下來為第二個成員dda分配空間,這時下一個可以分配的地址對于結(jié)構(gòu)的起始地址的偏移量為8,是sizeof(char)的倍數(shù),所以把dda存放在偏移量為8的地方滿足對齊方式,該成員變量占用 sizeof(char)=1個字節(jié);接下來為第三個成員type分配空間,這時下一個可以分配的地址對于結(jié)構(gòu)的起始地址的偏移量為9,不是sizeof (int)=4的倍數(shù),為了滿足對齊方式對偏移量的約束問題,VC自動填充3個字節(jié)(這三個字節(jié)沒有放什么東西),這時下一個可以分配的地址對于結(jié)構(gòu)的起始地址的偏移量為12,剛好是sizeof(int)=4的倍數(shù),所以把type存放在偏移量為12的地方,該成員變量占用sizeof(int)=4個字節(jié);這時整個結(jié)構(gòu)的成員變量已經(jīng)都分配了空間,總的占用的空間大小為:8+1+3+4=16,剛好為結(jié)構(gòu)的字節(jié)邊界數(shù)(即結(jié)構(gòu)中占用最大空間的類型所占用的字節(jié)數(shù)sizeof(double)=8)的倍數(shù),所以沒有空缺的字節(jié)需要填充。所以整個結(jié)構(gòu)的大小為:sizeof(MyStruct)=8+1+ 3+4=16,其中有3個字節(jié)是VC自動填充的,沒有放任何有意義的東西。
下面再舉個例子,交換一下上面的MyStruct的成員變量的位置,使它變成下面的情況:
struct MyStruct
{
char dda;
double dda1;
int type
};
這個結(jié)構(gòu)占用的空間為多大呢?在VC6.0環(huán)境下,可以得到sizeof(MyStruc)為24。結(jié)合上面提到的分配空間的一些原則,分析下VC怎么樣為上面的結(jié)構(gòu)分配空間的。(簡單說明)
struct MyStruct
{
char dda;//偏移量為0,滿足對齊方式,dda占用1個字節(jié);
double dda1;//下一個可用的地址的偏移量為1,不是sizeof(double)=8的倍數(shù),需要補(bǔ)足7個字節(jié)才能使偏移量變?yōu)?(滿足對齊方式),因此VC自動填充7個字節(jié),dda1存放在偏移量為8的地址上,它占用8個字節(jié)。
int type;//下一個可用的地址的偏移量為16,是sizeof(int)=4的倍數(shù),滿足int的對齊方式,所以不需要VC自動填充,type存放在偏移量為16的地址上,它占用4個字節(jié)。
};
所有成員變量都分配了空間,空間總的大小為1+7+8+4=20,不是結(jié)構(gòu)的節(jié)邊界數(shù)(即結(jié)構(gòu)中占用最大空間的類型所占用的字節(jié)數(shù)sizeof(double)=8)的倍數(shù),所以需要填充4個字節(jié),以滿足結(jié)構(gòu)的大小為sizeof(double)=8的倍數(shù)。所以該結(jié)構(gòu)總的大小為:sizeof(MyStruc)為1+7+8+4+4=24。其中總的有7+4=11個字節(jié)是VC自動填充的,沒有放任何有意義的東西。
VC對結(jié)構(gòu)的存儲的特殊處理確實提高CPU存儲變量的速度,但是有時候也帶來了一些麻煩,我們也屏蔽掉變量默認(rèn)的對齊方式,自己可以設(shè)定變量的對齊方式。VC 中提供了#pragma pack(n)來設(shè)定變量以n字節(jié)對齊方式。n字節(jié)對齊就是說變量存放的起始地址的偏移量有兩種情況:第一、如果n大于等于該變量所占用的字節(jié)數(shù),那么偏移量必須滿足默認(rèn)的對齊方式,第二、如果n小于該變量的類型所占用的字節(jié)數(shù),那么偏移量為n的倍數(shù),不用滿足默認(rèn)的對齊方式。結(jié)構(gòu)的總大小也有個約束條件,分下面兩種情況:如果n大于所有成員變量類型所占用的字節(jié)數(shù),那么結(jié)構(gòu)的總大小必須為占用空間最大的變量占用的空間數(shù)的倍數(shù);否則必須為n的倍數(shù)。
下面舉例說明其用法。
#pragma pack(push) //保存對齊狀態(tài)
#pragma pack(4)//設(shè)定為4字節(jié)對齊
struct test
{
char m1;
double m4;
int m3;
};
#pragma pack(pop)//恢復(fù)對齊狀態(tài)
以上結(jié)構(gòu)的大小為16,下面分析其存儲情況,首先為m1分配空間,其偏移量為0,滿足我們自己設(shè)定的對齊方式(4字節(jié)對齊),m1占用1個字節(jié)。接著開始為 m4分配空間,這時其偏移量為1,需要補(bǔ)足3個字節(jié),這樣使偏移量滿足為n=4的倍數(shù)(因為sizeof(double)大于n),m4占用8個字節(jié)。接著為m3分配空間,這時其偏移量為12,滿足為4的倍數(shù),m3占用4個字節(jié)。這時已經(jīng)為所有成員變量分配了空間,共分配了16個字節(jié),滿足為n的倍數(shù)。如果把上面的#pragma pack(4)改為#pragma pack(16),那么我們可以得到結(jié)構(gòu)的大小為24。(請讀者自己分析)
五、再看下面這個例子
這里有三點很重要:
1.每個成員分別按自己的方式對齊,并能最小化長度。
2.復(fù)雜類型(如結(jié)構(gòu))的默認(rèn)對齊方式是它最長的成員的對齊方式,這樣在成員是復(fù)雜類型時,可以最小化長度。
3.對齊后的長度必須是成員中最大的對齊參數(shù)的整數(shù)倍,這樣在處理數(shù)組時可以保證每一項都邊界對齊。
六、sizeof例子(注意:下面的例子都是經(jīng)過測試驗證的)
char bufc[32];
std::cout <<"bufc size"<<sizeof(bufc)<<std::endl;//32
struct teststruct{};
class testclass{};
std::cout <<"struct size"<<sizeof(teststruct)<<std::endl;//1
std::cout <<"class size"<<sizeof(testclass)<<std::endl;//1
class A
{
char c;
int val;
short sh;
};
class B
{
public:
char c;
int val;
short sh;
void func1(void){};
virtual void func2(void){};
};
std::cout <<"class size A"<<sizeof(A)<<std::endl;//12
std::cout <<"class size B"<<sizeof(B)<<std::endl;//16
char*p =NULL;
p=new char[100];
std::cout <<"size p"<<sizeof(p)<<std::endl;//4
新聞熱點
疑難解答