国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

在Python中使用base64模塊處理字符編碼的教程

2019-11-25 17:37:04
字體:
供稿:網(wǎng)友

Base64是一種用64個字符來表示任意二進(jìn)制數(shù)據(jù)的方法。

用記事本打開exe、jpg、pdf這些文件時,我們都會看到一大堆亂碼,因?yàn)槎M(jìn)制文件包含很多無法顯示和打印的字符,所以,如果要讓記事本這樣的文本處理軟件能處理二進(jìn)制數(shù)據(jù),就需要一個二進(jìn)制到字符串的轉(zhuǎn)換方法。Base64是一種最常見的二進(jìn)制編碼方法。

Base64的原理很簡單,首先,準(zhǔn)備一個包含64個字符的數(shù)組:

['A', 'B', 'C', ... 'a', 'b', 'c', ... '0', '1', ... '+', '/']

然后,對二進(jìn)制數(shù)據(jù)進(jìn)行處理,每3個字節(jié)一組,一共是3x8=24bit,劃為4組,每組正好6個bit:

2015428170554476.png (286×141)

這樣我們得到4個數(shù)字作為索引,然后查表,獲得相應(yīng)的4個字符,就是編碼后的字符串。

所以,Base64編碼會把3字節(jié)的二進(jìn)制數(shù)據(jù)編碼為4字節(jié)的文本數(shù)據(jù),長度增加33%,好處是編碼后的文本數(shù)據(jù)可以在郵件正文、網(wǎng)頁等直接顯示。

如果要編碼的二進(jìn)制數(shù)據(jù)不是3的倍數(shù),最后會剩下1個或2個字節(jié)怎么辦?Base64用/x00字節(jié)在末尾補(bǔ)足后,再在編碼的末尾加上1個或2個=號,表示補(bǔ)了多少字節(jié),解碼的時候,會自動去掉。

Python內(nèi)置的base64可以直接進(jìn)行base64的編解碼:

>>> import base64>>> base64.b64encode('binary/x00string')'YmluYXJ5AHN0cmluZw=='>>> base64.b64decode('YmluYXJ5AHN0cmluZw==')'binary/x00string'

由于標(biāo)準(zhǔn)的Base64編碼后可能出現(xiàn)字符+和/,在URL中就不能直接作為參數(shù),所以又有一種"url safe"的base64編碼,其實(shí)就是把字符+和/分別變成-和_:

>>> base64.b64encode('i/xb7/x1d/xfb/xef/xff')'abcd++//'>>> base64.urlsafe_b64encode('i/xb7/x1d/xfb/xef/xff')'abcd--__'>>> base64.urlsafe_b64decode('abcd--__')'i/xb7/x1d/xfb/xef/xff'

還可以自己定義64個字符的排列順序,這樣就可以自定義Base64編碼,不過,通常情況下完全沒有必要。

Base64是一種通過查表的編碼方法,不能用于加密,即使使用自定義的編碼表也不行。

Base64適用于小段內(nèi)容的編碼,比如數(shù)字證書簽名、Cookie的內(nèi)容等。

由于=字符也可能出現(xiàn)在Base64編碼中,但=用在URL、Cookie里面會造成歧義,所以,很多Base64編碼后會把=去掉:

# 標(biāo)準(zhǔn)Base64:'abcd' -> 'YWJjZA=='# 自動去掉=:'abcd' -> 'YWJjZA'

去掉=后怎么解碼呢?因?yàn)锽ase64是把3個字節(jié)變?yōu)?個字節(jié),所以,Base64編碼的長度永遠(yuǎn)是4的倍數(shù),因此,需要加上=把Base64字符串的長度變?yōu)?的倍數(shù),就可以正常解碼了。

請寫一個能處理去掉=的base64解碼函數(shù):

>>> base64.b64decode('YWJjZA==')'abcd'>>> base64.b64decode('YWJjZA')Traceback (most recent call last): ...TypeError: Incorrect padding>>> safe_b64decode('YWJjZA')'abcd'

小結(jié)

Base64是一種任意二進(jìn)制到文本字符串的編碼方法,常用于在URL、Cookie、網(wǎng)頁中傳輸少量二進(jìn)制數(shù)據(jù)。

發(fā)表評論 共有條評論
用戶名: 密碼:
驗(yàn)證碼: 匿名發(fā)表
主站蜘蛛池模板: 高陵县| 京山县| 浦城县| 东台市| 衡南县| 平阴县| 伊春市| 恩平市| 高平市| 绥宁县| 宁德市| 资源县| 勐海县| 沙洋县| 共和县| 荃湾区| 南岸区| 沭阳县| 聂拉木县| 博野县| 昌宁县| 封丘县| 黑龙江省| 正蓝旗| 潜江市| 府谷县| 乐东| 烟台市| 平顶山市| 南木林县| 姚安县| 嘉义市| 庆云县| 铜陵市| 阿坝| 新昌县| 聂拉木县| 辽阳县| 汉川市| 贵州省| 德令哈市|