国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 網站 > 幫助中心 > 正文

如果去除采集內容里的鏈接和廣告

2024-07-09 22:58:34
字體:
來源:轉載
供稿:網友

一般我們采集規則寫好后,比較郁悶的就是內容里的鏈接了,因為我不想看到內容里有別人網站的鏈接,當然更不用說廣告了。這里需要說明的是,下面的方式只可以替換掉一些規則或者相對規則的鏈接和廣告,只要那些比較變態的網站在內容里加很多隨機文字的,那就沒辦法了。

過濾廣告最簡單的方式是在“過濾廣告正則”的輸入框里輸入相應的正則,4.7以前的沒有帶,4.7以后的系統帶的有,下面是個比較全些的廣告過濾正則:

<a[!--ad--]>,</a>,<A[!--ad--]>,</A>,<div[!--ad--]>,</div>,<DIV[!--ad--]>,</DIV>,<iframe[!--ad--]</iframe>,<IFRAME[!--ad--]</IFRAME>

基本上已經夠了。

如果過濾內容里的鏈接呢?這里可以在 過濾選項 的 替換:(針對標題與內容) 里輸入正則,多個用逗號分開,但是不要在這里寫<a[!--ad--]>,</a>,<A[!--ad--]>,</A>,這樣的正則,因為這樣你會采不到頁面,呵呵,它把你采集的頁面都給過濾了。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 永仁县| 元江| 平塘县| 尉犁县| 霸州市| 旌德县| 阜南县| 清河县| 安泽县| 新兴县| 乳源| 西乌珠穆沁旗| 潮安县| 汶上县| 康定县| 明光市| 平江县| 胶州市| 湖州市| 方山县| 林周县| 丽江市| 万荣县| 永顺县| 柳河县| 金川县| 简阳市| 芮城县| 文水县| 北京市| 宣化县| 东阿县| 琼海市| 化州市| 盐池县| 会泽县| 穆棱市| 梅州市| 南木林县| 博湖县| 漾濞|