如下所示:
p1 = r'(?<=<div class="ds_cr">)(.*?)(?=<div id="pageurl">)' #這樣采集html時出錯,采集不到數據,正則中 . 是不能匹配換行符,改成如下:p1 = r'(?<=<div class="ds_cr">)([/s/S]*?)(?=<div id="pageurl">)' # 這是我們寫的正則表達式規則,你現在可以不理解啥意思
[/s/S]
/s
匹配任何空白字符,包括空格、制表符、換頁符等等。等價于[ /f/n/r/t/v]。
/S
匹配任何非空白字符。等價于[^ /f/n/r/t/v]。
以上這篇淺談Python采集網頁時正則表達式匹配換行符的問題就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持VEVB武林網。
新聞熱點
疑難解答