国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > CMS > 帝國Empire > 正文

如果去除采集內容里的鏈接和廣告

2024-08-28 12:27:14
字體:
來源:轉載
供稿:網友

一般我們采集規則寫好后,比較郁悶的就是內容里的鏈接了,因為我不想看到內容里有別人網站的鏈接,當然更不用說廣告了。這里需要說明的是,下面的方式只可以替換掉一些規則或者相對規則的鏈接和廣告,只要那些比較變態的網站在內容里加很多隨機文字的,那就沒辦法了。

過濾廣告最簡單的方式是在“過濾廣告正則”的輸入框里輸入相應的正則,4.7以前的沒有帶,4.7以后的系統帶的有,下面是個比較全些的廣告過濾正則:

<a[!--ad--]>,</a>,<A[!--ad--]>,</A>,<div[!--ad--]>,</div>,<DIV[!--ad--]>,</DIV>,<iframe[!--ad--]</iframe>,<IFRAME[!--ad--]</IFRAME>

基本上已經夠了。

如果過濾內容里的鏈接呢?這里可以在 過濾選項 的 替換:(針對標題與內容) 里輸入正則,多個用逗號分開,但是不要在這里寫<a[!--ad--]>,</a>,<A[!--ad--]>,</A>,這樣的正則,因為這樣你會采不到頁面,呵呵,它把你采集的頁面都給過濾了。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 西丰县| 正阳县| 霸州市| 调兵山市| 华蓥市| 称多县| 四川省| 内乡县| 富蕴县| 竹北市| 赣州市| 荥经县| 祁连县| 台湾省| 托克逊县| 文山县| 扶风县| 毕节市| 牟定县| 宁都县| 交口县| 时尚| 安阳市| 凉城县| 中山市| 南丹县| 香格里拉县| 绿春县| 晋城| 砀山县| 炎陵县| 万州区| 乐都县| 娄底市| 宜阳县| 温宿县| 宝清县| 康马县| 漳浦县| 固镇县| 鹤峰县|