国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > C++ > 正文

C++使用WideCharToMultiByte函數生成UTF-8編碼文件的方法

2020-01-26 14:32:14
字體:
來源:轉載
供稿:網友

WideCharToMultiByte函數映射一個unicode字符串到一個多字節字符串。

函數原型:

int WideCharToMultiByte
  • UINT CodePage, //指定執行轉換的代碼頁
  • DWORD dwFlags, //允許你進行額外的控制,它會影響使用了讀音符號(比如重音)的字符
  • LPCWSTR lpWideCharStr, //指定要轉換為寬字節字符串的緩沖區
  • int cchWideChar, //指定由參數lpWideCharStr指向的緩沖區的字符個數
  • LPSTR lpMultiByteStr, //指向接收被轉換字符串的緩沖區
  • int cchMultiByte, //指定由參數lpMultiByteStr指向的緩沖區最大值
  • LPCSTR lpDefaultChar, //遇到一個不能轉換的寬字符,函數便會使用pDefaultChar參數指向的字符
  • LPBOOL pfUsedDefaultChar //至少有一個字符不能轉換為其多字節形式,函數就會把這個變量設為TRUE

參數:
CodePage:指定執行轉換的代碼頁,這個參數可以為系統已安裝或有效的任何代碼頁所給定的值。你也可以指定其為下面的任意一值:

  • CP_ACP:ANSI代碼頁;CP_MACCP:Macintosh代碼頁;CP_OEMCP:OEM代碼頁;
  • CP_SYMBOL:符號代碼頁(42);CP_THREAD_ACP:當前線程ANSI代碼頁;
  • CP_UTF7:使用UTF-7轉換;CP_UTF8:使用UTF-8轉換。

相關變量

  • lpWideCharStr:指向將被轉換的unicode字符串。
  • cchWideChar:指定由參數lpWideCharStr指向的緩沖區的字符個數。如果這個值為-1,字符串將被設定為以NULL為結束符的字符串,并且自動計算長度。
  • lpMultiByteStr:指向接收被轉換字符串的緩沖區。
  • cchMultiByte:指定由參數lpMultiByteStr指向的緩沖區最大值(用字節來計量)。若此值為零,函數返回lpMultiByteStr指向的目標緩沖區所必需的字節數,在這種情況下,lpMultiByteStr參數通常為NULL。
  • lpDefaultChar和pfUsedDefaultChar:只有當WideCharToMultiByte函數遇到一個寬字節字符,而該字符在uCodePage參數標識的代碼頁中并沒有它的表示法時,WideCharToMultiByte函數才使用這兩個參數。如果寬字節字符不能被轉換,該函數便使用lpDefaultChar參數指向的字符。如果該參數是NULL(這是大多數情況下的參數值),那么該函數使用系統的默認字符。該默認字符通常是個問號。這對于文件名來說是危險的,因為問號是個通配符。pfUsedDefaultChar參數指向一個布爾變量,如果Unicode字符串中至少有一個字符不能轉換成等價多字節字符,那么函數就將該變量置為TRUE。如果所有字符均被成功地轉換,那么該函數就將該變量置為FALSE。當函數返回以便檢查寬字節字符串是否被成功地轉換后,可以測試該變量。
  • 返回值:如果函數運行成功,并且cchMultiByte不為零,返回值是由 lpMultiByteStr指向的緩沖區中寫入的字節數;如果函數運行成功,并且cchMultiByte為零,返回值是接收到待轉換字符串的緩沖區所必需的字節數。如果函數運行失敗,返回值為零。若想獲得更多錯誤信息,請調用GetLastError函數。它可以返回下面所列錯誤代碼:
  • ERROR_INSUFFICIENT_BJFFER;ERROR_INVALID_FLAGS;
  • ERROR_INVALID_PARAMETER;ERROR_NO_UNICODE_TRANSLATION。
  • 注意:指針lpMultiByteStr和lpWideCharStr必須不一樣。如果一樣,函數將失敗,GetLastError將返回ERROR_INVALID_PARAMETER的值。
  • Windows CE:不支持參數CodePage中的CP_UTF7和CP_UTF8的值,以及參數dwFlags中的WC_NO_BEST_FIT_CHARS值。

生成utf-8編碼的文件
步驟如下:
1. 首先要寫一個BOM頭。UTF-8文件一般是要這個頭的,當然也可以沒有。
2. 將要生成的字符先使用寬字符格式生成,然后調用WideCharToMultiByte轉為utf-8編碼,寫入文件。

例子如下:

FILE * pFile = fopen("d://a.txt", "w");   char szBOM[4] = {(char)0xEF, (char)0xBB, (char)0xBF, 0};   fprintf(pFile, "%s", szBOM);      wchar_t chNum[11] = L"零壹貳叁肆伍陸柒捌玖";   wchar_t chNum2[10] = L"億千百拾萬千百拾個";   char sz[10] = "112304823";      wchar_t result[32] = L"";      int offset = 0;   for(int i = 0; i < strlen(sz); ++ i)   {     char c = sz[i];          wchar_t w1 = chNum[ c - '0'];     wchar_t w2 = chNum2[i];     swprintf(result + offset, L"%c%c", w1, w2);     offset += 2;   }   char szChar[64] = "";   ::WideCharToMultiByte(CP_UTF8, 0, result, wcslen(result), szChar, 64, 0, 0);   fprintf(pFile, "%s", szChar);   fclose(pFile); 

注意的是,當使用wchar_t而不再是char時,所有的字符串操作函數都需要時w系列的,例如wcslen、swprintf

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 西城区| 鲁山县| 西乌珠穆沁旗| 陆川县| 昌邑市| 武陟县| 三门峡市| 册亨县| 海丰县| 金昌市| 寿光市| 胶南市| 辽宁省| 泗水县| 宜章县| 土默特右旗| 麻阳| 手游| 清镇市| 饶河县| 厦门市| 盐城市| 桑日县| 辛集市| 左贡县| 雅安市| 平原县| 内乡县| 长子县| 沅江市| 宣威市| 吴旗县| 罗城| 蚌埠市| 湟中县| 佳木斯市| 进贤县| 沂南县| 开化县| 武山县| 定安县|