国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > CMS > Wordpress > 正文

WordPress博客如何記錄搜索引擎蜘蛛爬行痕跡

2024-09-07 00:50:09
字體:
來源:轉載
供稿:網友

要統計蜘蛛爬行痕跡我們在php中使用HTTP_USER_AGENT獲取用戶行為信息,然后再判斷是不是包括搜索引擎蜘蛛的相關參數了,如果有就是搜索引擎蜘蛛了.

WordPress博客記錄搜索引擎蜘蛛爬行痕跡插件:

1、搜索引擎蜘蛛爬行記錄器Spider Tracker插件可以記錄百度、谷歌、雅虎、必應、搜狗、搜搜6種搜索引擎的蜘蛛爬行痕跡,并生成統計圖表,可以清晰的看到,近6日的各種搜索引擎的蜘蛛數量,以及當日的哪些時間,蜘蛛來過站里,又抓取了哪些網址。

2、wp-log-robots 插件大小僅3KB,wp-log-robots是一個記錄搜索引擎蜘蛛爬蟲活動記錄的WordPress插件,插件主文件只有一個 wp-log-robots.php,關鍵它的統計數據不用添加到數據庫中,而是以文本文件記錄下來的,比如你的博客地址是:http://m.survivalescaperooms.com,那么機器人日志文件的存放位置是:/robots_log.txt 。我們只要把這個地址添加到搜藏夾,就可以方便的查看各個搜索引擎的抓取情況。

在博客后臺插件-安裝插件-搜索“wp-log-robots”-點擊現在安裝,然后再插件頁面啟用該插件,不需要設置,就會開始記錄搜索引擎機器人的爬行記錄,提示:插件剛啟動的時候robots_log.txt 文件還沒有建立,是個404頁面,要等有搜索引擎來過之后,才會建立這個文件.)

WordPress博客記錄搜索引擎蜘蛛爬行痕跡代碼:

1.首先,在wordpress主題根目錄建立一個robots.php文件,寫入以下內容,支持搜索引擎如下,可以記錄Baidu,Google,Bing,Yahoo,Soso,Sogou,Yodao爬行網站的記錄! 

php代碼如下:

  1. <?php  
  2. function get_naps_bot()  
  3. {  
  4. $useragent = strtolower($_SERVER['HTTP_USER_AGENT']);  
  5. if (strpos($useragent'googlebot') !== false){  
  6. return 'Google';  
  7. }  
  8. if (strpos($useragent'baiduspider') !== false){  
  9. return 'Baidu';  
  10. }  
  11. if (strpos($useragent'msnbot') !== false){  
  12. return 'Bing';  
  13. }  
  14. if (strpos($useragent'slurp') !== false){  
  15. return 'Yahoo';  
  16. }  
  17. if (strpos($useragent'sosospider') !== false){  
  18. return 'Soso';  
  19. }  
  20. if (strpos($useragent'sogou spider') !== false){  
  21. return 'Sogou';  
  22. }  
  23. if (strpos($useragent'yodaobot') !== false){  
  24. return 'Yodao';  
  25. }  
  26. return false;  
  27. }  
  28. function nowtime(){  
  29. $date=date("Y-m-d.G:i:s");  
  30. return $date;  
  31. }  
  32. $searchbot = get_naps_bot();  
  33. if ($searchbot) {  
  34. $tlc_thispage = addslashes($_SERVER['HTTP_USER_AGENT']);  
  35. $url=$_SERVER['HTTP_REFERER'];  
  36. $file="m.survivalescaperooms.com.txt";  
  37. $time=nowtime();  
  38. $data=fopen($file,"a");  
  39. fwrite($data,"Time:$time robot:$searchbot URL:$tlc_thispagen");  
  40. fclose($data);  
  41. }  
  42. //http://m.survivalescaperooms.com收集整理  
  43. ?> 

將其上傳于你的主題目錄內.

2.在Footer.php或header.php的適當位置添加以下代碼調用robots.php,查看源代碼打印幫助:<?php include(’robots.php’) ?>

程序原理:通過對蜘蛛標識符(如Baiduspider、Googlebot)的判斷,記錄蜘蛛爬行時間,并生成日志文件robotslogs.txt于根目錄.

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 黄龙县| 深水埗区| 鄯善县| 桐乡市| 浮山县| 芜湖县| 桃江县| 阿拉善盟| 蒲江县| 民县| 霍林郭勒市| 沁水县| 五莲县| 巩义市| 大竹县| 固始县| 南雄市| 大悟县| 鄂温| 平邑县| 萍乡市| 商都县| 正宁县| 枝江市| 都匀市| 乌鲁木齐县| 兖州市| 伽师县| 黄骅市| 虹口区| 北流市| 安多县| 义马市| 牡丹江市| 苏尼特左旗| 任丘市| 吉安市| 吉安市| 深泽县| 宁海县| 拜泉县|