web采集的數據為 %u6B63%u5F0F%u4EBA%u5458,需要讀取并轉換為python對象,想了下不調用Javascript去eval,只能自己翻譯了。
核心代碼:
import reimport codecspattern = re.compile('%u[0-9A-Z]{4}')n = codecs.open('d://new.txt', 'w', 'utf-8') with open('d://p', 'r') as f: for l in f: for i in pattern.findall(l): l = l.replace(i, unichr(int(i[2:], 16))) n.write(l)n.close()
|
新聞熱點
疑難解答
圖片精選