這篇博客主要是用來簡單的總結一下java中的編碼方式
在程序中如果沒有處理好字符的編碼,就有可能出現亂碼的問題。下面我們一起介紹在開發中常見的編碼問題有哪些。
在計算機的世界里,任何文字都是以指定的編碼方式存在的。
常見的編碼有:ISO8859-1,GBK/GB2312,Unicode,UTF
ISO8859-1 屬于單字節編碼,最多只能表示0-255的字符范圍,主要在英文上引用,表示漢字的時候則亂碼,因為漢字占據兩個字節
GBK/GB2312 中文的國際編碼,專門用來表示漢字,是雙字節編碼
Unicode java中就是使用此編碼方式,也是最標準的一種編碼,是使用16進制表示的編碼。但是這個編碼不兼容iso8859-1編碼
UTF 由于Unicode不支持iso8859-1編碼,而且容易占據更多的空間而且對于英文字母也需要使用兩個字節編碼,這樣使用unicode不便于傳輸和存儲,因此產生了utf編碼,utf編碼兼容了iso8859-1編碼,也可以用來表示所有語言字符,不過utf是不定長的編碼,每個字符的長度從1-6個字節不等,一般在中文的網頁中使用此編碼,因為這樣可以節省空間。
造成亂碼的根本原因: 1.程序使用的編碼與本機的編碼不統一 2.在網絡中,客戶端與服務端編碼不統一
新聞熱點
疑難解答