base64模塊是用來作base64編碼解碼的。這種編碼方式在電子郵件中是很常見的。
它可以把不能作為文本顯示的二進制數據編碼為可顯示的文本信息。編碼后的文本大小會增大1/3。
閑話不說了,base64模塊真正用的上的方法只有8個,分別是encode, decode, encodestring, decodestring, b64encode,b64decode, urlsafe_b64decode,urlsafe_b64encode。他們8個可以兩兩分為4組,encode,decode一組,專門用來編碼和 解碼文件的,也可以對StringIO里的數據做編解碼;encodestring,decodestring一組,專門用來編碼和解碼字符串; b64encode和b64decode一組,用來編碼和解碼字符串,并且有一個替換符號字符的功能。這個功能是這樣的:因為base64編碼后的字符除 了英文字母和數字外還有三個字符 + / =, 其中=只是為了補全編碼后的字符數為4的整數,而+和/在一些情況下需要被替換的,b64encode和b64decode正是提供了這樣的功能。至于什 么情況下+和/需要被替換,最常見的就是對url進行base64編碼的時候。urlsafe_b64encode和urlsafe_b64decode 一組,這個就是用來專門對url進行base64編解碼的,實際上也是調用的前一組函數。
基本用法
首先準備一個64個字符的數組[‘A','B','C', … , ‘1', ‘2', … , ‘+']
然后對二進制數據進行處理, 每三個字節(byte)一組, 一共是3x8=24, 劃為4組,每組6bit.這樣我們得到4個數字作為索引, 然后查表獲得相應的4個字符, 就是編碼后的字符串.
如果編碼的二進制數不是3的倍數怎么辦,base64在/x00在末尾不足后,在代碼的末尾添加1~2個=號,解碼是自動去掉
import base64me = base64.b64encode("mink")print me # print 'bWluaw=='會把少的字符用=號補上
print base64.b64decode(me) # print 'mink'
可以解碼得到原有的字符串
urlsafe_b64encode 和 urlsafe_b64decode
base64的還提供用于url的編碼方法urlsafe_b64encode 和urlsafe_b64decode.
me = base64.urlsafe_b64encode('i/xb7/x1d/xfb/xef/xff')print me # print 'abcd--__'print base64.urlsafe_b64decode(me) print 'abcd++//'因為base64編碼后+和-可能會出現在字符中,所以通過urlsafe的方法把+轉換為-,/轉化為_.
由于=字符也可能出現在Base64編碼中,但=用在URL Cookie里面會造成歧義,很多Base64編碼后會把=去掉.去掉=后怎么解碼呢?因為Base64是把3個字節變為4個字節,所以Base64編碼的長度永遠是4的倍數.因此需要加上=把Base64字符串的長度變為4的倍數,就可以正常解碼了.
綜合示例
#-*- encoding:gb2312 -*-import base64import StringIOa = "this is a test"b = base64.encodestring(a) # 對字符串編碼print bprint base64.decodestring(b) # 對字符串解碼c = StringIO.StringIO()c.write(a)d = StringIO.StringIO()e = StringIO.StringIO()c.seek(0)base64.encode(c, d) # 對StringIO內的數據進行編碼print d.getvalue()d.seek(0)base64.decode(d, e) # 對StringIO內的數據進行解碼print e.getvalue()a = "this is a +test"b = base64.urlsafe_b64encode(a) # 進行url的字符串編碼print bprint base64.urlsafe_b64decode(b)
上面的encode函數和decode函數的參數其實還可以是文件對象的,那的象這樣:
f1 = open('aaa.txt', 'r')f2 = open('bbb.txt', 'w')base64.encode(f1, f2)f1.close()f2.close()新聞熱點
疑難解答
圖片精選