国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 開發 > Linux Shell > 正文

Linux/Nginx如何查看搜索引擎蜘蛛爬蟲的行為

2020-07-27 19:04:45
字體:
來源:轉載
供稿:網友

摘要

做好網站SEO優化的第一步就是首先讓蜘蛛爬蟲經常來你的網站進行光顧,下面的Linux命令可以讓你清楚的知道蜘蛛的爬行情況。下面我們針對nginx服務器進行分析,日志文件所在目錄:/usr/local/nginx/logs/access.log,access.log這個文件記錄的應該是最近一天的日志情況,首先請看看日志大小,如果很大(超過50MB)建議別用這些命令分析,因為這些命令很消耗CPU,或者更新下來放到分析機上執行,以免影響網站的速度。

Linux shell命令

1. 百度蜘蛛爬行的次數

cat access.log | grep Baiduspider | wc

最左面的數值顯示的就是爬行次數。

2. 百度蜘蛛的詳細記錄(Ctrl C可以終止)

cat access.log | grep Baiduspider

也可以用下面的命令:

cat access.log | grep Baiduspider | tail -n 10
cat access.log | grep Baiduspider | head -n 10

只看最后10條或最前10條,這用就能知道這個日志文件的開始記錄的時間和日期。

3. 百度蜘蛛抓取首頁的詳細記錄

cat access.log | grep Baiduspider | grep “GET / HTTP”

百度蜘蛛好像對首頁非常熱愛每個鐘頭都來光顧,而谷歌和雅虎蜘蛛更喜歡內頁。

4. 百度蜘蛛派性記錄時間點分布

cat access.log | grep “Baiduspider ” | awk ‘{print $4}'

5. 百度蜘蛛爬行頁面按次數降序列表

cat access.log | grep “Baiduspider ” | awk ‘{print $7}' | sort | uniq -c | sort -r

文中的Baiduspider 改成Googlebot都可以查看谷歌的數據,鑒于大陸的特殊性,大家應該對百度的log更為關注。

附:(Mediapartners-Google)Google adsense蜘蛛的詳細爬行記錄

cat access.log | grep Mediapartners

Mediapartners-Google是什么呢?Google adsense廣告之所以能與內容相關,因為每個包含著adsense的廣告被訪問后,很快就有個Mediapartners-Google蜘蛛來到這個頁面,所以幾分鐘后再刷新就能顯示相關性廣告了,真厲害啊!

ps:linux下nginx如何啟用網站日志,查看蜘蛛爬蟲

默認的路徑是你安裝時候指定的

如果用的LNMP之類的安裝包

你可以在SHELL下

whereisnginx

找到相應的路徑之后

在NGINX下的CONF文件夾里看配置文件,日志文件如果記錄了話

在配置文件里有路徑的~

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 银川市| 灯塔市| 铅山县| 安岳县| 永福县| 横峰县| 兴隆县| 临泉县| 石门县| 巩义市| 铁岭县| 潮州市| 长汀县| 花莲县| 乌拉特后旗| 图片| 曲松县| 平原县| 边坝县| 金华市| 玉山县| 枝江市| 眉山市| 甘德县| 博湖县| 陇南市| 阿坝| 瑞丽市| 汕头市| 怀集县| 大余县| 岢岚县| 渝中区| 谢通门县| 石棉县| 四会市| 宣城市| 顺昌县| 安庆市| 丰顺县| 通州区|