国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > .NET > 正文

C標(biāo)準(zhǔn)庫源碼解剖(3):字符處理函數(shù)ctype.h和wctype.h

2024-07-10 13:27:14
字體:
供稿:網(wǎng)友

 字符處理包括分類(即屬性判斷)和轉(zhuǎn)換函數(shù)。ASCII字符主要可分類為控制字符、空白字符、可打印字符、數(shù)字字符、字母字符(大寫和小寫)、標(biāo)點(diǎn)符號等。
    1、ctype.h: 標(biāo)準(zhǔn)的屬性判斷函數(shù)有isalnum,isalpha,iscntrl,isdigit,isxdigit,isgraph,isprint,ispunct,islower,isupper,isspace, isblank(C99中引入)共12個(gè)函數(shù)。標(biāo)準(zhǔn)的屬性轉(zhuǎn)換函數(shù)有tolower和toupper。當(dāng)然具體的實(shí)現(xiàn)中還會提供一些非標(biāo)準(zhǔn)函數(shù)作為擴(kuò)展,如glibc的實(shí)現(xiàn)中提供了isctype,isascii,toascii。

 

[cpp] view plaincopy
  1. /* ISO C99 Standard 7.4: 字符處理   <ctype.h> */  
  2. #ifndef _CTYPE_H  
  3. #define _CTYPE_H    1  
  4. #include <features.h>   /* 定義了一些表示編譯選項(xiàng)的宏 */  
  5. #include <bits/types.h>  
  6. __BEGIN_DECLS  
  7. #ifndef _ISbit  
  8. /* 下面這些是所有的字符屬性,如果超過16種不同的屬性,那很多使用unsigned short int的 
  9.     的函數(shù)代碼都要改變。這些屬性被存儲為網(wǎng)絡(luò)字節(jié)序(大端字節(jié)序),我們?yōu)槊總€(gè)屬性定義一個(gè) 
  10.     依賴于機(jī)器字節(jié)序的比特位解釋 */  
  11. # include <endian.h>  
  12. # if __BYTE_ORDER == __BIG_ENDIAN  /* 如果是大端字節(jié)序 */  
  13. #  define _ISbit(bit)   (1 << (bit))  
  14. # else /* 否則__BYTE_ORDER==__LITTLE_ENDIAN,是小端字節(jié)序 */  
  15. #  define _ISbit(bit)   ((bit) < 8 ? ((1 << (bit)) << 8) : ((1 << (bit)) >> 8))  
  16. # endif  
  17. enum  
  18. {  
  19.   _ISupper = _ISbit (0),    /* 大寫字母字符A~Z:0x41~0x5A  */  
  20.   _ISlower = _ISbit (1),    /* 小寫字母字符a~z:0x61~0x7A  */  
  21.   _ISalpha = _ISbit (2),    /* 字母字符A~Za~z  */  
  22.   _ISdigit = _ISbit (3),    /* 十進(jìn)制數(shù)字字符0~9:0x30~0x39  */  
  23.   _ISxdigit = _ISbit (4),   /* 十六進(jìn)制數(shù)字字符0~9A~Fa~f  */  
  24.   _ISspace = _ISbit (5),    /* 空白字符:0x9~0xD,0x20。包括水平制表符/t,換行符/n, 
  25.                                        垂直制表符/v,換頁符/f,回車符/r,空格符' '  */  
  26.   _ISprint = _ISbit (6),    /* 可打印字符:0x20~0x7E。即任何非控制字符  */  
  27.   _ISgraph = _ISbit (7),    /* 圖形字符:除空格以外的可打印字符  */  
  28.   _ISblank = _ISbit (8),    /* 空白分隔符:通常是空格符和水平制表符(Space和Tab鍵)  */  
  29.   _IScntrl = _ISbit (9),    /* 控制字符:0x0~0x1F,0x7F  */  
  30.   _ISpunct = _ISbit (10),   /* 標(biāo)點(diǎn)符號  */  
  31.   _ISalnum = _ISbit (11)    /* 字母和數(shù)字字符  */  
  32. };  
  33. #endif /* ! _ISbit  */  
  34. /* 這些函數(shù)定義在ctype-info.c中。這里的描述必須與localeinfo.h中的一致。 
  35.     在依賴于線程的區(qū)域模型中(參看<local.h>中的uselocale),我們不能像過去那樣對這些 
  36.     函數(shù)使用全局變量,現(xiàn)在這些訪問函數(shù)返回每個(gè)變量的地址,這是多線程環(huán)境中當(dāng)前線程的本 
  37.     地地址。 
  38.     這些指針指向一個(gè)大小為384的數(shù)組中,因此它們可以通過以下幾種下標(biāo)值來訪問:任何[0,255]內(nèi)的 
  39.    unsigend char值;EOF(-1);任何[-128,-1)內(nèi)的signed char值。ISO C要求ctype中 
  40.     的函數(shù)工作在unsigend char或EOF上;這里我們同時(shí)也支持負(fù)的signed char值以兼容老的程序。 
  41.     大小寫轉(zhuǎn)換數(shù)組是int的,而不是unsigned char,因?yàn)閠olower(EOF)的結(jié)果必須是EOF,這并不 
  42.     是一個(gè)unsigned char。但是今天更重要的是數(shù)組也會在多字節(jié)字符集中使用 */  
  43. extern __const unsigned short int **__ctype_b_loc (void)  
  44.      __attribute__ ((__const));  
  45. extern __const __int32_t **__ctype_tolower_loc (void)  
  46.      __attribute__ ((__const));  
  47. extern __const __int32_t **__ctype_toupper_loc (void)  
  48.      __attribute__ ((__const));  
  49. #define __isctype(c, type) /  
  50.   ((*__ctype_b_loc ())[(int) (c)] & (unsigned short int) type)  
  51. #define __isascii(c)    (((c) & ~0x7f) == 0) /* 如果C是一個(gè)7比特的值,說明是一個(gè)ascii字符(0~127)  */  
  52. #define __toascii(c)    ((c) & 0x7f)        /* 屏蔽掉高位  */  
  53. /* 用宏來聲明ctype中的各個(gè)函數(shù)原型,以簡化代碼 */  
  54. #define __exctype(name) extern int name (int) __THROW  
  55. __BEGIN_NAMESPACE_STD  
  56. /* 下面的名稱是所有的函數(shù): 
  57.    int isCHARACTERISTIC(int c);  
  58.    當(dāng)且僅當(dāng)C有屬性CHARACTERISTIC時(shí)返回非0值(真),  
  59.    對CHARACTERISTIC名稱的含義,參看上面的enum 
  60.    函數(shù)形參是一個(gè)字符,用int類型描述 */  
  61. __exctype (isalnum);  /* 這里是各個(gè)函數(shù)原型聲明 */  
  62. __exctype (isalpha);  
  63. __exctype (iscntrl);  
  64. __exctype (isdigit);  
  65. __exctype (islower);  
  66. __exctype (isgraph);  
  67. __exctype (isprint);  
  68. __exctype (ispunct);  
  69. __exctype (isspace);  
  70. __exctype (isupper);  
  71. __exctype (isxdigit);  
  72. /* 返回C的小寫形式  */  
  73. extern int tolower (int __c) __THROW;  
  74. /* 返回C的大寫形式  */  
  75. extern int toupper (int __c) __THROW;  
  76. __END_NAMESPACE_STD  
  77.   
  78. /* ISO C99引入了一個(gè)新函數(shù)  */  
  79. #ifdef  __USE_ISOC99  
  80. __BEGIN_NAMESPACE_C99  
  81. __exctype (isblank);  
  82. __END_NAMESPACE_C99  
  83. #endif  
  84. #ifdef __USE_GNU  
  85. /* 根據(jù)掩碼MASK來測試C是否屬于某個(gè)字符集  */  
  86. extern int isctype (int __c, int __mask) __THROW;  
  87. #endif  
  88. #if defined __USE_SVID || defined __USE_MISC || defined __USE_XOPEN  
  89. /* 返回非0值,當(dāng)且僅當(dāng)C是ASCII字符集中(例如,不足7比特的寬度)  */  
  90. extern int isascii (int __c) __THROW;  
  91. /* 返回C中在ASCII字符集中的那部分(例如,C的低位7比特)  */  
  92. extern int toascii (int __c) __THROW;  
  93. /* 下面的原型與toupper和tolower相同,唯一不同的它們不檢查實(shí)參是否在char的范圍內(nèi) */  
  94. __exctype (_toupper);  
  95. __exctype (_tolower);  
  96. #endif /* Use SVID or use misc.  */  
  97. /* 下面代碼用于優(yōu)化的轉(zhuǎn)換函數(shù)中 */  
  98. #define __tobody(c, f, a, args) /  
  99.   (__extension__                                  /  
  100.    ({ int __res;                                  /  
  101.       if (sizeof (c) > 1)                              /  
  102.     {                                     /  
  103.       if (__builtin_constant_p (c))                       /  
  104.         {                                     /  
  105.           int __c = (c);                              /  
  106.           __res = __c < -128 || __c > 255 ? __c : (a)[__c];             /  
  107.         }                                     /  
  108.       else                                    /  
  109.         __res = f args;                           /  
  110.     }                                     /  
  111.       else                                    /  
  112.     __res = (a)[(int) (c)];                           /  
  113.       __res; }))  
  114. #if !defined __NO_CTYPE && !defined __cplusplus  
  115. # define isalnum(c) __isctype((c), _ISalnum)  
  116. # define isalpha(c) __isctype((c), _ISalpha)  
  117. # define iscntrl(c) __isctype((c), _IScntrl)  
  118. # define isdigit(c) __isctype((c), _ISdigit)  
  119. # define islower(c) __isctype((c), _ISlower)  
  120. # define isgraph(c) __isctype((c), _ISgraph)  
  121. # define isprint(c) __isctype((c), _ISprint)  
  122. # define ispunct(c) __isctype((c), _ISpunct)  
  123. # define isspace(c) __isctype((c), _ISspace)  
  124. # define isupper(c) __isctype((c), _ISupper)  
  125. # define isxdigit(c)    __isctype((c), _ISxdigit)  
  126. # ifdef __USE_ISOC99  
  127. #  define isblank(c)    __isctype((c), _ISblank)  
  128. # endif  
  129. # ifdef __USE_EXTERN_INLINES  
  130. __extern_inline int  
  131. __NTH (tolower (int __c))  
  132. {  
  133.   return __c >= -128 && __c < 256 ? (*__ctype_tolower_loc ())[__c] : __c;  
  134. }  
  135. __extern_inline int  
  136. __NTH (toupper (int __c))  
  137. {  
  138.   return __c >= -128 && __c < 256 ? (*__ctype_toupper_loc ())[__c] : __c;  
  139. }  
  140. # endif  
  141. # if __GNUC__ >= 2 && defined __OPTIMIZE__ && !defined __cplusplus  
  142. #  define tolower(c)    __tobody (c, tolower, *__ctype_tolower_loc (), (c))  
  143. #  define toupper(c)    __tobody (c, toupper, *__ctype_toupper_loc (), (c))  
  144. # endif /* Optimizing gcc */  
  145. # if defined __USE_SVID || defined __USE_MISC || defined __USE_XOPEN  
  146. #  define isascii(c)    __isascii (c)  
  147. #  define toascii(c)    __toascii (c)  
  148. #  define _tolower(c)   ((int) (*__ctype_tolower_loc ())[(int) (c)])  
  149. #  define _toupper(c)   ((int) (*__ctype_toupper_loc ())[(int) (c)])  
  150. # endif  
  151. #endif /* Not __NO_CTYPE.  */  
  152. /* 下面是GNU對各個(gè)屬性分類函數(shù)和轉(zhuǎn)換函數(shù)的擴(kuò)展接口,每個(gè)函數(shù)有一個(gè)對應(yīng)的擴(kuò)展版本, 
  153.     增加了一個(gè)參數(shù)用來傳遞區(qū)域設(shè)置 */  
  154.       
  155. /* ...... */  
  156. __END_DECLS  
  157. #endif /* ctype.h  */  

 

 

[cpp] view plaincopy
  1. /* ctype.c:各個(gè)字符處理函數(shù)的實(shí)現(xiàn)  */  
  2. #define __NO_CTYPE  
  3. #include <ctype.h>  
  4. /* 為所有的ctype宏提供實(shí)際的函數(shù)實(shí)現(xiàn)  */  
  5. #define func(name, type) /  
  6.   int name (int c) { return __isctype (c, type); }  
  7. func (isalnum, _ISalnum)  
  8. func (isalpha, _ISalpha)  
  9. func (iscntrl, _IScntrl)  
  10. func (isdigit, _ISdigit)  
  11. func (islower, _ISlower)  
  12. func (isgraph, _ISgraph)  
  13. func (isprint, _ISprint)  
  14. func (ispunct, _ISpunct)  
  15. func (isspace, _ISspace)  
  16. func (isupper, _ISupper)  
  17. func (isxdigit, _ISxdigit)  
  18. #define __ctype_tolower /  
  19.   ((int32_t *) _NL_CURRENT (LC_CTYPE, _NL_CTYPE_TOLOWER) + 128)  
  20. #define __ctype_toupper /  
  21.   ((int32_t *) _NL_CURRENT (LC_CTYPE, _NL_CTYPE_TOUPPER) + 128)  
  22. int  
  23. tolower (int c)  
  24. {  
  25.   return c >= -128 && c < 256 ? __ctype_tolower[c] : c;  
  26. }  
  27. int  
  28. toupper (int c)  
  29. {  
  30.   return c >= -128 && c < 256 ? __ctype_toupper[c] : c;  
  31. }  

 

    解釋:
    (1)字符的所有屬性類被封裝在一個(gè)enum中,每個(gè)屬性對應(yīng)一個(gè)枚舉常量。
    (2)在作為接口的頭文件中,由于各個(gè)函數(shù)的類型相同,都接受int型字符,返回int型的值,因此原型聲明可用宏__exctype(name)來完成,name為函數(shù)名,這樣可以簡化代碼。
    (3)所有的屬性判斷函數(shù)的實(shí)現(xiàn)都是用宏__isctype(c, type)和返回?cái)?shù)組指針的外部函數(shù)__ctype_b_loc()來完成。在實(shí)現(xiàn)文件ctype.c中可以看到,所有的判斷函數(shù)都只有一條語句“return __isctype (c, type);”。這個(gè)函數(shù)式宏用來判斷字符c是否具有屬性type(為枚舉常量),它直接以字符c為下標(biāo),獲得__ctype_b_loc()數(shù)組相應(yīng)位置處的元素,并與屬性作邏輯與運(yùn)算,若結(jié)果為非0,說明字符具有該屬性,若結(jié)果為0則說明字符沒有該屬性。__ctype_b_loc()函數(shù)在glibc庫的ctype-info.c文件中定義,它直接使用了glibc 2.0中已經(jīng)實(shí)現(xiàn)的內(nèi)置函數(shù)。可見,這里用宏來實(shí)現(xiàn)ctype,使之可以擴(kuò)展,增加任意的屬性。當(dāng)然,我們也可以自己來實(shí)現(xiàn)這些屬性函數(shù),代碼都很簡單,只要判斷其ASCII編碼范圍即可。
    (4)ctype.c中的tolower和toupper函數(shù)實(shí)現(xiàn)使用了宏__ctype_tolower,這個(gè)宏會被映射成一個(gè)數(shù)組。它直接根據(jù)字符c的范圍__ctype_tolower[c]或c本身。
    (5)ctype.h下面的優(yōu)化實(shí)現(xiàn)用于需要優(yōu)化的環(huán)境中(比如用帶優(yōu)化選項(xiàng)的gcc來編譯)。它直接把屬性判斷函數(shù)定義為宏,宏體就是__isctype (c, type)。定義成宏時(shí)就少了一層函數(shù)調(diào)用。tolower和toupper根據(jù)需要,或者用外部函數(shù)__ctype_tolower_loc()和__ctype_toupper_loc()來實(shí)現(xiàn),并實(shí)現(xiàn)成內(nèi)聯(lián)函數(shù);或者直接定義成宏,用這里定義的__tobody(c, f, a, args)來實(shí)現(xiàn)。這兩者都差不多,因?yàn)閮?nèi)聯(lián)函數(shù)也相當(dāng)于具有宏的特征。
    (6)__BEGIN_DECLS/__END_DECLS宏用來表示數(shù)據(jù)結(jié)構(gòu)、全局變量、函數(shù)原型聲明的開始和結(jié)束。這類似于MFC中的BEGIN_MESSAGE_MAP/END_MESSAGE_MAP。__BEGIN_NAMESPACE_STD/__END_NAMESPACE_STD宏表示C標(biāo)準(zhǔn)庫函數(shù)原型聲明的開始和結(jié)束。__BEGIN_NAMESPACE_C99/__END_NAMESPACE_C99表示C99標(biāo)準(zhǔn)中的函數(shù)聲明。
   2、wctype.h: C89增補(bǔ)1中引入,是ctype.h中各個(gè)函數(shù)的寬字符處理版本,能對寬字符進(jìn)行屬性分類和轉(zhuǎn)換。還定義了通用屬性類型wctype_t,表示字符轉(zhuǎn)換的類型wctrans_t,構(gòu)造屬性的函數(shù)wctype,測試屬性的通用函數(shù)iswctype,構(gòu)造轉(zhuǎn)換的函數(shù)wctrans,實(shí)行轉(zhuǎn)換的通用函數(shù)towctrans。

[cpp] view plaincopy
  1. /* ISO C99 Standard: 7.25  寬字符分類和轉(zhuǎn)換函數(shù)   <wctype.h>  */  
  2. #ifndef _WCTYPE_H  
  3. #include <features.h>  
  4. #include <bits/types.h>  
  5. #ifndef __need_iswxxx  
  6. # define _WCTYPE_H  1  
  7. /* 從<wchar.h>中獲取wint_t類型  */  
  8. # define __need_wint_t  
  9. # include <wchar.h>  
  10. /* wint_t類型的常量表達(dá)式,其值不是擴(kuò)展字符集的任何成員 */  
  11. # ifndef WEOF  
  12. #  define WEOF (0xffffffffu)  
  13. # endif  
  14. #endif  
  15. #undef __need_iswxxx  
  16. /* 當(dāng)<wcsmbs.h>在Unix98兼容的代碼中使用時(shí),下面部分也會在<wcsmbs.h>頭文件中被使用 */  
  17. #ifndef __iswxxx_defined  
  18. # define __iswxxx_defined   1  
  19. __BEGIN_NAMESPACE_C99  
  20. /* 標(biāo)量類型,該類型的值表示特定區(qū)域字符的分類 */  
  21. typedef unsigned long int wctype_t;   
  22. __END_NAMESPACE_C99  
  23. # ifndef _ISwbit  
  24. /* 這些屬性總是被存儲為網(wǎng)絡(luò)字節(jié)序(大端字節(jié))。我們?yōu)槊總€(gè)屬性定義一個(gè) 
  25.     依賴于機(jī)器字節(jié)序的比特位解釋 */  
  26. #  include <endian.h>  
  27. #  if __BYTE_ORDER == __BIG_ENDIAN  
  28. #   define _ISwbit(bit) (1 << (bit))  
  29. #  else /* 否則__BYTE_ORDER==__LITTLE_ENDIAN,是小端字節(jié)序 */  
  30. #   define _ISwbit(bit) /  
  31.     ((bit) < 8 ? (int) ((1UL << (bit)) << 24)                  /  
  32.      : ((bit) < 16 ? (int) ((1UL << (bit)) << 8)               /  
  33.         : ((bit) < 24 ? (int) ((1UL << (bit)) >> 8)                /  
  34.            : (int) ((1UL << (bit)) >> 24))))  
  35. #  endif  
  36. enum  
  37. {  
  38.   __ISwupper = 0,           /* 大寫寬字符 */  
  39.   __ISwlower = 1,           /* 小寫寬字符  */  
  40.   __ISwalpha = 2,           /* 字母寬字符  */  
  41.   __ISwdigit = 3,           /* 十進(jìn)制數(shù)字寬字符  */  
  42.   __ISwxdigit = 4,          /* 十六進(jìn)制數(shù)字寬字符  */  
  43.   __ISwspace = 5,           /* 空白寬字符  */  
  44.   __ISwprint = 6,           /* 可打印寬字符  */  
  45.   __ISwgraph = 7,           /* 圖形寬字符  */  
  46.   __ISwblank = 8,           /* 空白分隔寬字符:通常是空格符和水平制表符(Space和Tab鍵)  */  
  47.   __ISwcntrl = 9,           /* 控制寬字符  */  
  48.   __ISwpunct = 10,          /* 標(biāo)點(diǎn)符號寬字符  */  
  49.   __ISwalnum = 11,          /* 字母和數(shù)字寬字符  */  
  50.   _ISwupper = _ISwbit (__ISwupper), /* UPPERCASE.  */  
  51.   _ISwlower = _ISwbit (__ISwlower), /* lowercase.  */  
  52.   _ISwalpha = _ISwbit (__ISwalpha), /* Alphabetic.  */  
  53.   _ISwdigit = _ISwbit (__ISwdigit), /* Numeric.  */  
  54.   _ISwxdigit = _ISwbit (__ISwxdigit),   /* Hexadecimal numeric.  */  
  55.   _ISwspace = _ISwbit (__ISwspace), /* Whitespace.  */  
  56.   _ISwprint = _ISwbit (__ISwprint), /* Printing.  */  
  57.   _ISwgraph = _ISwbit (__ISwgraph), /* Graphical.  */  
  58.   _ISwblank = _ISwbit (__ISwblank), /* Blank (usually SPC and TAB).  */  
  59.   _ISwcntrl = _ISwbit (__ISwcntrl), /* Control character.  */  
  60.   _ISwpunct = _ISwbit (__ISwpunct), /* Punctuation.  */  
  61.   _ISwalnum = _ISwbit (__ISwalnum)  /* Alphanumeric.  */  
  62. };  
  63. # endif /* Not _ISwbit  */  
  64.   
  65. __BEGIN_DECLS  
  66. __BEGIN_NAMESPACE_C99  
  67. /* 
  68.  * 寬字符分類函數(shù): 7.15.2.1. 
  69.  */  
  70. /* 測試c是否是字母或數(shù)字寬字符,等價(jià)于iswalpha(c) || iswdigit(c) */  
  71. extern int iswalnum (wint_t __wc) __THROW;  
  72. /* 測試c是否是特定區(qū)域設(shè)置的字母寬字符,在iswlower(c)或isupper(c)為真時(shí)取值為真, 
  73.     在iswcntrl(c),iswdigit(c),iswpunct(c)或iswspace(c)為真時(shí)取值為假 */  
  74. extern int iswalpha (wint_t __wc) __THROW;  
  75. /* 測試是否是控制型的寬字符  */  
  76. extern int iswcntrl (wint_t __wc) __THROW;  
  77. /* 測試是否是十進(jìn)制的數(shù)字寬字符  */  
  78. extern int iswdigit (wint_t __wc) __THROW;  
  79. /* 測試是否是圖形寬字符,等價(jià)于iswprint(c) && !iswspace(c)  */  
  80. extern int iswgraph (wint_t __wc) __THROW;  
  81. /* 測試是否是小寫寬字符,等價(jià)于!iswcntrl(c) && !iswdigit(c) && !iswpunct(c)  
  82.    && !iswspace(c) */  
  83. extern int iswlower (wint_t __wc) __THROW;  
  84. /* 測試是否是可打印寬字符  */  
  85. extern int iswprint (wint_t __wc) __THROW;  
  86. /* 測試是否是標(biāo)點(diǎn)符號寬字符,等價(jià)于iswprint(c) && !iswalnum(c) && !iswspace(c)  */  
  87. extern int iswpunct (wint_t __wc) __THROW;  
  88. /* 測試是否是空白寬字符,等價(jià)于!iswalnum(c) && !iswgraph(c) && !ispunct(c)  */  
  89. extern int iswspace (wint_t __wc) __THROW;  
  90. /* 測試是否是大寫寬字符,等價(jià)于!iswcntrl(c) && !iswdigit(c) && !iswpunct(c)  
  91.    && !iswspace(c) */  
  92. extern int iswupper (wint_t __wc) __THROW;  
  93. /* 測試是否是十六進(jìn)制的數(shù)字寬字符  */  
  94. extern int iswxdigit (wint_t __wc) __THROW;  
  95. /* 測試是否是空白分隔寬字符  */  
  96. # ifdef __USE_ISOC99  
  97. extern int iswblank (wint_t __wc) __THROW;  
  98. # endif  
  99. /* 
  100.  * 可擴(kuò)展的寬字符分類函數(shù): 7.15.2.2. 
  101.  */  
  102. /* 構(gòu)造一個(gè)wctype_t類型的值,表示由字符串PROPERTY標(biāo)識的寬字符類 */  
  103. extern wctype_t wctype (__const char *__property) __THROW;  
  104. /* 確定寬字符WC是否是DESC所標(biāo)識的寬字符類 */  
  105. extern int iswctype (wint_t __wc, wctype_t __desc) __THROW;  
  106. __END_NAMESPACE_C99  
  107. /* 
  108.  * 寬字符的大小寫轉(zhuǎn)換函數(shù): 7.15.3.1. 
  109.  */  
  110. __BEGIN_NAMESPACE_C99  
  111. /* 標(biāo)量類型,該類型的值表示特定區(qū)域的寬字符轉(zhuǎn)換 */  
  112. typedef __const __int32_t *wctrans_t;  
  113. __END_NAMESPACE_C99  
  114. #ifdef __USE_GNU  
  115. __USING_NAMESPACE_C99(wctrans_t)  
  116. #endif  
  117. __BEGIN_NAMESPACE_C99  
  118. /* 把大寫寬字符轉(zhuǎn)換成對應(yīng)的小寫寬字符  */  
  119. extern wint_t towlower (wint_t __wc) __THROW;  
  120. /* 把小寫寬字符成對應(yīng)的大寫寬字符 */  
  121. extern wint_t towupper (wint_t __wc) __THROW;  
  122. __END_NAMESPACE_C99  
  123. __END_DECLS  
  124. #endif  /* need iswxxx.  */  
  125.   
  126. /* 剩下的定義和聲明一定不能出現(xiàn)在<wcsmbs.h>中 */  
  127. #ifdef _WCTYPE_H  
  128. /* 
  129.  * 可擴(kuò)展的寬字符轉(zhuǎn)換函數(shù): 7.15.3.2. 
  130.  */  
  131. __BEGIN_DECLS  
  132. __BEGIN_NAMESPACE_C99  
  133. /* 構(gòu)造一個(gè)wctrans_t類型的值,表示由字符串PROPERTY標(biāo)識的寬字符轉(zhuǎn)換 */  
  134. extern wctrans_t wctrans (__const char *__property) __THROW;  
  135. /* 使用DESC所示的轉(zhuǎn)換來對寬字符WC進(jìn)行轉(zhuǎn)換 */  
  136. extern wint_t towctrans (wint_t __wc, wctrans_t __desc) __THROW;  
  137. __END_NAMESPACE_C99  
  138. /* 下面是GNU對各個(gè)分類函數(shù)和轉(zhuǎn)換函數(shù)的擴(kuò)展接口,每個(gè)函數(shù)有一個(gè)對應(yīng)的擴(kuò)展版本, 
  139.     增加了一個(gè)參數(shù)用來傳遞區(qū)域設(shè)置 */  
  140.       
  141. /* ...... */  
  142. __END_DECLS  
  143. #endif  /* __WCTYPE_H defined.  */  
  144. #endif /* wctype.h  */  

 

 

[cpp] view plaincopy
  1. /* wcfuncs.c:各個(gè)寬字符處理函數(shù)的實(shí)現(xiàn) */  
  2. #include <ctype.h>  
  3. #include <wctype.h>  
  4. #include <locale/localeinfo.h>  
  5. #include "wchar-lookup.h"  
  6. /* 為所有wctype的原型提供實(shí)際的函數(shù)實(shí)現(xiàn)  */  
  7. #define func(name, type)                              /  
  8.   extern int __isw##name (wint_t __wc);                       /  
  9.   int                                         /  
  10.   __isw##name (wint_t wc)                             /  
  11.   {                                       /  
  12.     if (isascii (wc))                                 /  
  13.       return is##name ((int) wc);                         /  
  14.     size_t i = _NL_CURRENT_WORD (LC_CTYPE, _NL_CTYPE_CLASS_OFFSET) + type;    /  
  15.     const char *desc = _NL_CURRENT (LC_CTYPE, i);                 /  
  16.     return wctype_table_lookup (desc, wc);                    /  
  17.   }                                       /  
  18.   weak_alias (__isw##name, isw##name)  
  19. #undef iswalnum  
  20. func (alnum, __ISwalnum)  
  21. libc_hidden_weak (iswalnum)  
  22. #undef iswalpha  
  23. func (alpha, __ISwalpha)  
  24. libc_hidden_weak (iswalpha)  
  25. #undef iswblank  
  26. func (blank, __ISwblank)  
  27. #undef iswcntrl  
  28. func (cntrl, __ISwcntrl)  
  29. #undef iswdigit  
  30. func (digit, __ISwdigit)  
  31. libc_hidden_weak (iswdigit)  
  32. #undef iswlower  
  33. func (lower, __ISwlower)  
  34. libc_hidden_weak (iswlower)  
  35. #undef iswgraph  
  36. func (graph, __ISwgraph)  
  37. #undef iswprint  
  38. func (print, __ISwprint)  
  39. #undef iswpunct  
  40. func (punct, __ISwpunct)  
  41. #undef iswspace  
  42. func (space, __ISwspace)  
  43. libc_hidden_weak (iswspace)  
  44. #undef iswupper  
  45. func (upper, __ISwupper)  
  46. #undef iswxdigit  
  47. func (xdigit, __ISwxdigit)  
  48. libc_hidden_weak (iswxdigit)  
  49. #undef towlower  
  50. /* towlower函數(shù)的實(shí)現(xiàn) */  
  51. wint_t  
  52. towlower (wc)  
  53.      wint_t wc;  
  54. {  
  55.   /* 獲取區(qū)域設(shè)置表中當(dāng)前區(qū)域類別的索引 */  
  56.   size_t i = _NL_CURRENT_WORD (LC_CTYPE, _NL_CTYPE_MAP_OFFSET) + __TOW_tolower;  
  57.   /* 根據(jù)索引,獲取當(dāng)前區(qū)域設(shè)置類別的描述字符串 */  
  58.   const char *desc = _NL_CURRENT (LC_CTYPE, i);  
  59.   return wctrans_table_lookup (desc, wc); /* 搜索位表,以獲得轉(zhuǎn)換后的寬字符,并返回 */  
  60. }  
  61. libc_hidden_def (towlower)  
  62. #undef towupper  
  63. /* towupper函數(shù)的實(shí)現(xiàn) */  
  64. wint_t  
  65. towupper (wc)  
  66.      wint_t wc;  
  67. {  
  68.   /* 獲取區(qū)域設(shè)置表中當(dāng)前區(qū)域類別的索引 */  
  69.   size_t i = _NL_CURRENT_WORD (LC_CTYPE, _NL_CTYPE_MAP_OFFSET) + __TOW_toupper;  
  70.   /* 根據(jù)索引,獲取當(dāng)前區(qū)域設(shè)置類別的描述字符串 */  
  71.   const char *desc = _NL_CURRENT (LC_CTYPE, i);  
  72.   return wctrans_table_lookup (desc, wc); /* 搜索位表,以獲得轉(zhuǎn)換后的寬字符,并返回 */  
  73. }  
  74. libc_hidden_def (towupper)  

 

   解釋:
   (1)wctype.h的實(shí)現(xiàn)更通用,它定義一個(gè)描述寬字符屬性的類型wctype_t,為unsigned long標(biāo)量類型,實(shí)現(xiàn)了可擴(kuò)展的、特定區(qū)域設(shè)置的寬字符分類功能。同樣它也把所有屬性類封裝在一個(gè)enum中,每個(gè)屬性對應(yīng)一個(gè)枚舉常量。wctype函數(shù)用來構(gòu)造一個(gè)字符屬性,參數(shù)為標(biāo)識這個(gè)屬性的字符串,主要有"alnum"、"alpha"、 "cntrl"、"digit"、"graph"、"lower"、"print"等,對應(yīng)iswxxx屬性分類函數(shù)。iswctype函數(shù)測試寬字符WC是否屬于DESC屬性類。調(diào)用iswctype時(shí)LC_CTYPE類別的設(shè)置應(yīng)與wctype構(gòu)造desc值時(shí)的LC_CTYPE設(shè)置相同。
   (2)寬字符集的分類取決于區(qū)域設(shè)置,其標(biāo)準(zhǔn)屬性類映射到ASCII中的關(guān)系要理清楚:
   字母或數(shù)字 = 字母 || 數(shù)字
   大(小)寫字母 = !控制字符 && !數(shù)字 && !標(biāo)點(diǎn)符號 && !空白字符
   字母 = (大寫字母 || 小寫字母) && !控制字符 && !數(shù)字 && !標(biāo)點(diǎn)符號 && !空白字符   
   圖形字符 = 可打印字符 && !空格
   標(biāo)點(diǎn)符號 = 可打印字符 && !字母 && !數(shù)字 && !空白字符
   空白字符 = !字母 && !數(shù)字 && !圖形字符 && !標(biāo)點(diǎn)符號
   (3)對字符屬性的轉(zhuǎn)換,wctype.h也定義了一個(gè)描述寬字符轉(zhuǎn)換的類型wctrans_t,為32位整型指針。wctrans函數(shù)用來構(gòu)造一個(gè)字符轉(zhuǎn)換,參數(shù)為標(biāo)識這個(gè)轉(zhuǎn)換的字符串,主要有"tolower"、"toupper",對應(yīng)towxxx轉(zhuǎn)換函數(shù),這個(gè)轉(zhuǎn)換針對當(dāng)前區(qū)域設(shè)置的LC_CTYPE類別值。towctrans函數(shù)使用DESC所示的轉(zhuǎn)換來對寬字符WC進(jìn)行轉(zhuǎn)換。
   (4)在函數(shù)實(shí)現(xiàn)文件wcfuncs.c中,同樣用了一個(gè)宏func(name, type)來簡化實(shí)現(xiàn)。實(shí)現(xiàn)代碼主要用到了_NL_CURRENT_WORD宏、LC_CTYPE類別宏、NL_CTYPE_MAP_OFFSET偏移宏。這些宏的功能在編譯器內(nèi)部或其附帶的庫中實(shí)現(xiàn)了。wctrans_table_lookup函數(shù)在wchar-lookup.h中定義,用于查詢映射表,以獲得轉(zhuǎn)換后的寬字符。映射表有點(diǎn)類似于Unix的文件結(jié)構(gòu),用32位的字作為下標(biāo)索引。寬字符集的每個(gè)字符被切割成4個(gè)比特塊存儲在位表的前面表項(xiàng)中,后面的幾個(gè)表項(xiàng)存放了一級子表、二級子表、以及三級子表的指針。

發(fā)表評論 共有條評論
用戶名: 密碼:
驗(yàn)證碼: 匿名發(fā)表
主站蜘蛛池模板: 姚安县| 分宜县| 仪陇县| 武义县| 沙洋县| 龙南县| 固安县| 囊谦县| 隆昌县| 盘锦市| 澄江县| 准格尔旗| 马关县| 高安市| 咸阳市| 双鸭山市| 常德市| 西畴县| 禄丰县| 富民县| 永宁县| 八宿县| 青海省| 台北县| 长治市| 阿巴嘎旗| 南昌市| 怀宁县| 周宁县| 玛多县| 姚安县| 枣庄市| 五常市| 灵台县| 黄梅县| 建宁县| 格尔木市| 长岛县| 宝鸡市| 化隆| 平湖市|