教你制作GBK與Unicode的對照表

2024-04-27 13:53:11

字體：大中小

來源：轉載

供稿：網友

前段時間，在所參與的項目中碰到了一個unicode與gb之間轉碼失敗的問題，一些不常用漢字的編碼都被轉成了“??”，這些漢字沒有顯示出來，于是自己對相關的問題做了一些研究并最終使問題得以解決。現在就結合前面兩篇的unicode與GB方面的基本原理，介紹這種制作GBK-Unicode編碼對照表的方法。

　　Java的字符串String類功能強大，不但能進行一些基本的字符串操作，還可以根據需要構造指定字符集的字符串，本文所介紹的方法正是利了這一點，這種方法的基本思路是：

　　1、遍歷GBK編碼表中的所有漢字，使用該字的GB編碼構造一個字符串。GBK編碼表中各部分的漢字分塊比較整潔，很輕易遍歷。

　　2、使用getBytes()方法取得該字符的字節數組，由于Java是用unicode來表示字符的，所以此漢字的unicode就在其中。

　　以下是一段示例代碼：

以下是引用片段：
{
int count = 0;
for(int segIndex=0xb0; segIndex<=0xf7; segIndex ) {
for(int charIndex=0xa1; charIndex<=0xfe; charIndex ) {
byte gbkBytes = new byte {(byte)(segIndex), (byte)charIndex};
byte unicodeBytes;
String str = new String(gbkBytes,"GBK");

unicodeBytes = str.getBytes("unicode");
if(unicodeBytes.length == 4) {
count ;
String buffer = "";
for (int i=0;i<gbkBytes.length;i )
buffer = (int)(0x00ff&gbkBytes[i]) " ";
for (int i=3;i>1;i--)
buffer = (int)(0x00ff&unicodeBytes[i]) " ";
buffer = " ";
osw.write(buffer);
}