国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 學院 > 開發設計 > 正文

scrapy 坑之roboot協議

2019-11-06 06:09:30
字體:
來源:轉載
供稿:網友

roboot協議也稱為機器人協議,或者爬蟲協議,他是指網站通過一個roboot.txt文件告訴遵循roboot協議的爬蟲引擎哪些頁面可以爬,哪些頁面不能爬取。比如天貓的一些網頁,搜索引擎就爬不到,但是這只是說,不讓爬,并不是說不能爬。只需在scrapy中設置使此爬蟲不遵循roboot協議即可。

做法:在setting.py中找到roboot的項(具體項的名字不記得了,在vim中只需搜索roboot即可。


發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 永靖县| 云霄县| 醴陵市| 额敏县| 龙陵县| 巴东县| 马龙县| 凉山| 兰西县| 荆门市| 都江堰市| 德令哈市| 辽宁省| 龙陵县| 清新县| 钦州市| 乌拉特中旗| 搜索| 乐山市| 浦北县| 津南区| 宾川县| 巴南区| 新昌县| 金塔县| 绥化市| 吐鲁番市| 昌图县| 崇信县| 罗定市| 合肥市| 明水县| 榆林市| 定兴县| 彩票| 上虞市| 株洲县| 兴山县| 城固县| 日喀则市| 五台县|