之前在extern “C” 用法詳解中已經(jīng)提到過符號的概念,它是編譯器對變量和函數(shù)的一種標(biāo)記,編譯器對C和C++代碼在生產(chǎn)符號時規(guī)則也是不一樣的,符號除了本身名字的區(qū)別外,還有強(qiáng)符號和弱符號之分
我們先看一段簡單的代碼
/* test.c */
void hello();
int main()
{
hello();
return 0;
}
很顯然,這段代碼是沒法鏈接通過的,它會報錯undefined reference to hello,說的是hello未定義,因為這里我們只聲明了函數(shù)hello,而沒有定義它。但是我們把代碼稍作修改如下
__attribute__((weak)) void hello();
int main()
{
hello();
return 0;
}
這時你會發(fā)現(xiàn),編譯鏈接都可通過,但是運(yùn)行會報錯,因為這時我們將hello聲明為了弱符號,在鏈接時弱符號會被鏈接器當(dāng)做0,執(zhí)行一個地址為0的函數(shù)當(dāng)然會報錯,改為如下代碼就不會報錯了,只是它沒有任何輸出
__attribute__((weak)) void hello();
int main()
{
if(hello)
hello();
return 0;
}
編譯器認(rèn)為,函數(shù)和初始化了的全局變量為強(qiáng)符號,未初始化的全局變量為弱符號,鏈接器在處理強(qiáng)符號和弱符號時有如下規(guī)則
1.不同目標(biāo)文件中,不允許有同名的強(qiáng)符號
2.如果一個符號在某個目標(biāo)文件中是強(qiáng)符號,在其它目標(biāo)文件中為弱符號,選擇強(qiáng)符號
3.如果一個符號在所有目標(biāo)文件中都是弱符號,選擇占用空間最大的,比如目標(biāo)文件A中有double global_var,文件B中有int global_var,double占用8字節(jié),大于int的4字節(jié),A和B鏈接后,符號global占8字節(jié)
對此我們可以簡單的驗證一下,有如下兩個文件
/* 1.c */
char global_var;
int main()
{
return 0;
}
/* 2.c */
int global_var;
全局變量global_var在兩個文件中都沒有初始化,因此都是弱符號,執(zhí)行編譯命令gcc 1.c 2.c,用readelf查看符號表readelf -s a.out,為了查看方便我們只輸出最后幾行
Num: Value Size Type Bind Vis Ndx Name
62: 0000000000600818 4 OBJECT GLOBAL DEFAULT 25 global_var
63: 0000000000400474 11 FUNC GLOBAL DEFAULT 13 main
64: 0000000000400358 0 FUNC GLOBAL DEFAULT 11 _init
這里符號global_var占用的size是4,說明鏈接器選擇的是占用空間更大的int global_var,我們再稍作修改,將1.c中的全局變量初始化,如下
/* 1.c */
char global_var = 1;
int main()
{
return 0;
}
/* 2.c */
int global_var;
這時1.c中的global_var為強(qiáng)符號,2.c中的global_var為弱符號,同樣編譯之后用readelf查看符號表readelf -s a.out如下
Num: Value Size Type Bind Vis Ndx Name
62: 0000000000600818 1 OBJECT GLOBAL DEFAULT 25 global_var
63: 0000000000400474 11 FUNC GLOBAL DEFAULT 13 main
64: 0000000000400358 0 FUNC GLOBAL DEFAULT 11 _init
此時符號global_var占用的size是1,說明鏈接器選擇的是強(qiáng)符號
在寫代碼時應(yīng)該盡量避免有不同類型的符號,否則會引發(fā)非常詭異且不易察覺的錯誤,為了避免可以采取如下措施:
1.上策:消除所有的全局變量
2.中策:將全局變量聲明為static類型,并提供接口供訪問
3.下策:全局變量一定要初始化,哪怕初始化為0
4.必備:打開gcc的-fno-common選項,它會禁止有不同類型的符號
說了這么多,好像在說應(yīng)該盡量用強(qiáng)符號,那弱符號有什么用呢,所謂存在即合理,有時候我們甚至需要顯示定義弱符號,這對庫函數(shù)會非常有用,比如庫中的弱符號可以被用戶自定義的強(qiáng)符號覆蓋,從而實現(xiàn)自定義的庫版本,或者在使用某些擴(kuò)展功能時,用戶可以定義一個弱符號,當(dāng)鏈接了該功能時,功能模塊可以正常使用,如果去掉功能模塊,程序也可正常鏈接,只是缺少某些功能而已,比如我們可以通過下面的代碼判斷程序是否鏈接了pthread庫,從而決定執(zhí)行什么樣的操作
/* test.c */
#include <stdio.h>
#include <pthread.h>
__attribute__((weak)) int pthread_create(
pthread_t*,
const pthread_attr_t*,
void*(*)(void*),
void*);
int main()
{
if (pthread_create)
{
printf("This is multi-thread version!/n");
}
else
{
printf("This is single-thread version!/n");
}
return 0;
}
編譯運(yùn)行結(jié)果如下
$ gcc test.c
$ ./a.out
This is single-thread version!
$ gcc test.c -lpthread
$ a.out
This is multi-thread version!