国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 網站 > 優(yōu)化推廣 > 正文

巧用robots避免蜘蛛黑洞

2024-04-26 13:21:18
字體:
來源:轉載
供稿:網友

以下是來自于百度站長學院的文章:

對于百度搜索引擎來說,蜘蛛黑洞特指網站通過極低的成本制造出大量參數過多,及內容雷同但具體參數不同的動態(tài)URL ,就像一個無限循環(huán)的“黑洞”將spider困住,Baiduspider浪費了大量資源抓取的卻是無效網頁。

       比如很多網站都有篩選功能,通過篩選功能產生的網頁經常會被搜索引擎大量抓取,而這其中很大一部分檢索價值不高,如“500-1000之間價格的租房”,首先網站(包括現實中)上基本沒有相關資源,其次站內用戶和搜索引擎用戶都沒有這種檢索習慣。這種網頁被搜索引擎大量抓取,只能是占用網站寶貴的抓取配額。那么該如何避免這種情況呢?

       我們以北京某團購網站為例,看看該網站是如何利用robots巧妙避免這種蜘蛛黑洞的:

對于普通的篩選結果頁,該網站選擇使用靜態(tài)鏈接,如:http://bj.XXXXX.com/category/zizhucan/weigongcun
       同樣是條件篩選結果頁,當用戶選擇不同排序條件后,會生成帶有不同參數的動態(tài)鏈接,而且即使是同一種排序條件(如:都是按銷量降序排列),生成的參數也都是不同的。如:http://bj.XXXXX.com/category/zizhucan/weigongcun/hot?mtt=1.index%2Fpoi.0.0.i1afqhek
http://bj.XXXXX.com/category/zizhucan/weigongcun/hot?mtt=1.index%2Fpoi.0.0.i1afqi5c

 對于該團購網來說,只讓搜索引擎抓取篩選結果頁就可以了,而各種帶參數的結果排序頁面則通過robots規(guī)則拒絕提供給搜索引擎。

       robots.txt的文件用法中有這樣一條規(guī)則:Disallow: /*?* ,即禁止搜索引擎訪問網站中所有的動態(tài)頁面。該網站恰是通過這種方式,對Baiduspider優(yōu)先展示高質量頁面、屏蔽了低質量頁面,為Baiduspider提供了更友好的網站結構,避免了黑洞的形成。

示例:

User-agent: *
Disallow: /*?*

 

發(fā)表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發(fā)表
主站蜘蛛池模板: 彰武县| 肃宁县| 武山县| 嘉荫县| 喀喇| 平湖市| 湘西| 宜兴市| 东光县| 山阴县| 汉阴县| 昌邑市| 邵阳县| 资兴市| 徐州市| 延边| 乐清市| 新宾| 宿松县| 景洪市| 安阳市| 景宁| 奇台县| 汉川市| 南木林县| 凤庆县| 古交市| 南京市| 台湾省| 六安市| 阿鲁科尔沁旗| 宁国市| 永宁县| 青神县| 长垣县| 隆化县| 广宗县| 长岛县| 扬中市| 梁山县| 宾阳县|