国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

Python3 中文文件讀寫方法

2020-02-22 22:57:45
字體:
來源:轉載
供稿:網友

字符串在Python內部的表示是Unicode編碼,因此,在做編碼轉換時,通常需要以Unicode作為中間編碼,即先將其他編碼的字符串解碼(decode)成Unicode,再從Unicode編碼(encode)成另一種編碼。

在新版本的python3中,取消了unicode類型,代替它的是使用unicode字符的字符串類型(str),字符串類型(str)成為基礎類型如下所示,而編碼后的變為了字節類型(bytes) 但是兩個函數的使用方法不變:

  decode    encodebytes ------> str(unicode)------>bytes
u = '中文' #指定字符串類型對象u str = u.encode('gb2312') #以gb2312編碼對u進行編碼,獲得bytes類型對象str u1 = str.decode('gb2312')#以gb2312編碼對字符串str進行解碼,獲得字符串類型對象u1 u2 = str.decode('utf-8')#如果以utf-8的編碼對str進行解碼得到的結果,將無法還原原來的字符串內容

文件讀取問題

假如我們讀取一個文件,文件保存時,使用的編碼格式,決定了我們從文件讀取的內容的編碼格式,例如,我們從記事本新建一個文本文件test.txt, 編輯內容,保存的時候注意,編碼格式是可以選擇的,例如我們可以選擇gb2312,那么使用python讀取文件內容,方式如下:

f = open('test.txt','r')s = f.read() #讀取文件內容,如果是不識別的encoding格式(識別的encoding類型跟使用的系統有關),這里將讀取失敗'''假設文件保存時以gb2312編碼保存'''u = s.decode('gb2312') #以文件保存格式對內容進行解碼,獲得unicode字符串'''下面我們就可以對內容進行各種編碼的轉換了'''str = u.encode('utf-8')#轉換為utf-8編碼的字符串strstr1 = u.encode('gbk')#轉換為gbk編碼的字符串str1str1 = u.encode('utf-16')#轉換為utf-16編碼的字符串str1

codecs進行文件的讀取

python給我們提供了一個包codecs進行文件的讀取,這個包中的open()函數可以指定編碼的類型:

import codecs f = codecs.open('text.text','r+',encoding='utf-8')#必須事先知道文件的編碼格式,這里文件編碼是使用的utf-8 content = f.read()#如果open時使用的encoding和文件本身的encoding不一致的話,那么這里將將會產生錯誤 f.write('你想要寫入的信息') f.close()

以上這篇Python3 中文文件讀寫方法就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持武林站長站。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 邢台县| 嘉荫县| 商洛市| 巴东县| 新丰县| 武夷山市| 三门县| 高尔夫| 赤城县| 海林市| 唐海县| 隆安县| 锡林浩特市| 都安| 日喀则市| 赤水市| 福建省| 女性| 黄冈市| 手游| 梁山县| 佳木斯市| 开江县| 新平| 绥化市| 巴彦县| 石城县| 临猗县| 大洼县| 神池县| 神木县| 孟连| 门源| 佛坪县| 赞皇县| 江口县| 鸡西市| 宣城市| 江源县| 天峻县| 綦江县|