国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 網站 > 幫助中心 > 正文

如果去除采集內容里的鏈接和廣告

2024-07-09 22:58:34
字體:
來源:轉載
供稿:網友

一般我們采集規則寫好后,比較郁悶的就是內容里的鏈接了,因為我不想看到內容里有別人網站的鏈接,當然更不用說廣告了。這里需要說明的是,下面的方式只可以替換掉一些規則或者相對規則的鏈接和廣告,只要那些比較變態的網站在內容里加很多隨機文字的,那就沒辦法了。

過濾廣告最簡單的方式是在“過濾廣告正則”的輸入框里輸入相應的正則,4.7以前的沒有帶,4.7以后的系統帶的有,下面是個比較全些的廣告過濾正則:

<a[!--ad--]>,</a>,<A[!--ad--]>,</A>,<div[!--ad--]>,</div>,<DIV[!--ad--]>,</DIV>,<iframe[!--ad--]</iframe>,<IFRAME[!--ad--]</IFRAME>

基本上已經夠了。

如果過濾內容里的鏈接呢?這里可以在 過濾選項 的 替換:(針對標題與內容) 里輸入正則,多個用逗號分開,但是不要在這里寫<a[!--ad--]>,</a>,<A[!--ad--]>,</A>,這樣的正則,因為這樣你會采不到頁面,呵呵,它把你采集的頁面都給過濾了。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 商水县| 临邑县| 兴海县| 罗源县| 兴宁市| 株洲县| 苍南县| 泌阳县| 子洲县| 滦南县| 盐津县| 临洮县| 合川市| 区。| 阿克苏市| 明星| 聂拉木县| 逊克县| 墨竹工卡县| 英吉沙县| 思茅市| 衡阳市| 和田县| 天峨县| 平定县| 江油市| 寻甸| 博爱县| 沅江市| 武夷山市| 仁怀市| 兰州市| 合江县| 通化县| 平塘县| 阿克苏市| 嘉祥县| 闽侯县| 连州市| 洛扎县| 凤庆县|