unicode是一種編碼方案, utf-8是unicode的一種實現(xiàn)方式。
python2 中a='啊哈哈', a的類型是str, 是編碼后的字節(jié)序列。a的長度是字節(jié)數(shù);而b的類型是unicode(存儲文本字符串), b的長度是字符數(shù)。
str –>decode(‘utf-8’) –> unicode unicode –>encode(‘utf-8’)–> str 寫入文件的時候str類型的可以直接寫入,unicode類型的必須encode之后寫入。
新聞熱點
疑難解答