轉義 escape:
反轉義 unescape:
抓網頁數據經常遇到例如>或者 這種HTML轉義符,抓到字符串里很是煩人。
比方說一個從網頁中抓到的字符串
html = '<abc>'用Python可以這樣處理:
import HTMLParserhtml_parser = HTMLParser.HTMLParser()txt = html_parser.unescape(html) #這樣就得到了txt = '<abc>'如果還想轉回去,可以這樣:
import cgihtml = cgi.escape(txt) # 這樣又回到了 html = '<abc>'來回轉的功能還分了兩個模塊實現,挺奇怪。沒找到更優美的方法,歡迎補充哈~
--------------------------------------------------
新聞熱點
疑難解答