如下所示:
p1 = r'(?<=<div class="ds_cr">)(.*?)(?=<div id="pageurl">)' #這樣采集html時(shí)出錯(cuò),采集不到數(shù)據(jù),正則中 . 是不能匹配換行符,改成如下:p1 = r'(?<=<div class="ds_cr">)([/s/S]*?)(?=<div id="pageurl">)' # 這是我們寫的正則表達(dá)式規(guī)則,你現(xiàn)在可以不理解啥意思
[/s/S]
/s
匹配任何空白字符,包括空格、制表符、換頁符等等。等價(jià)于[ /f/n/r/t/v]。
/S
匹配任何非空白字符。等價(jià)于[^ /f/n/r/t/v]。
以上這篇淺談Python采集網(wǎng)頁時(shí)正則表達(dá)式匹配換行符的問題就是小編分享給大家的全部?jī)?nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持武林站長(zhǎng)站。
新聞熱點(diǎn)
疑難解答
圖片精選