国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

<rp id="hbx1g"><del id="hbx1g"></del></rp>

首頁 > 服務器 > Linux服務器 > 正文

linux下5條提取百度蜘蛛Apache日志的命令

2024-09-05 23:01:05

字體：大中小

來源：轉載

供稿：網友

考慮到平時要做優化，看百度爬蟲到底爬取了哪些目錄，哪些鏈接或目錄被爬取的次數比較少，以便對頁面的鏈接做nofollow，robots.txt等屏蔽處理，引導爬蟲抓取哪些需要被爬取的頁面，提升整體的收錄率。

總結了用的較多幾條命令：

提取Apache日志百度蜘蛛的相關爬行記錄

1. 百度蜘蛛爬行的次數 cat access_log | grep Baiduspider+ | wc 最左面的數值顯示的就是爬行次數。

2. 百度蜘蛛的詳細記錄(Ctrl+C可以終止) cat access_log | grep Baiduspider+ 也可以用下面的命令： cat access_log | grep Baiduspider+ | tail -n 10 cat access_log | grep Baiduspider+ | head -n 10 只看最后10條或最前10條，這用就能知道這個日志文件的開始記錄的時間和日期。

3. 百度蜘蛛抓取首頁的詳細記錄 cat access_log | grep Baiduspider+ | grep “GET / HTTP”

4. 百度蜘蛛派性記錄時間點分布 cat access_log | grep “Baiduspider+” | awk ‘{print $4}’

5. 百度蜘蛛爬行頁面按次數降序列表 cat access_log | grep “Baiduspider+” | awk ‘{print $7}’ | sort | uniq -c | sort

上一篇：CentOS中服務器時間設為自動同步的方法

下一篇：Linux用mrtg監控網絡設備端口流量

學習交流

如何查找有故障的配件

如何查找有故障的配件...

熱門圖片

猜你喜歡的新聞

猜你喜歡的關注

新聞熱點

最牛同桌！我考了696分我同桌考了703分

2024-06-26 22:28:41

650分！高二女生考入北大：遺憾不能上高三

2024-06-26 22:26:16

男生估分600只考了397 媽媽：高考雖重要，但不代表所有

2024-06-26 22:23:01

唐尚珺回應是否會直播帶貨：有人出100萬想和他合作！

2024-06-25 19:29:23

名校搶人名場面：清華、北大太拼了！

2024-06-25 19:22:14

男生高考語文滿分！網友：第一次聽說

2024-06-25 19:19:15

疑難解答

圖片精選

網友關注

主站蜘蛛池模板：南靖县| 莲花县| 威远县| 新晃| 乐都县| 孟州市| 盘山县| 晋中市| 定边县| 江川县| 县级市| 芦溪县| 汤原县| 班戈县| 大田县| 枣庄市| 揭阳市| 泰兴市| 剑河县| 广灵县| 建德市| 廊坊市| 镇平县| 澄城县| 嵩明县| 吴桥县| 内丘县| 华亭县| 获嘉县| 肃北| 辛集市| 清水河县| 邓州市| 临湘市| 红河县| 八宿县| 嘉善县| 潮安县| 连江县| 和平区| 浦县|

<td id="cnzhj"></td>

<style id="cnzhj"><tbody id="cnzhj"></tbody></style>

<p id="cnzhj"></p>

<td id="cnzhj"><tr id="cnzhj"><th id="cnzhj"></th></tr></td>

<td id="cnzhj"></td>

<source id="cnzhj"><tr id="cnzhj"></tr></source>