6.1 最簡單的爬蟲
網(wǎng)絡(luò)爬蟲是一個(gè)自動(dòng)提取網(wǎng)頁的程序,它為搜索引擎從萬維網(wǎng)上下載網(wǎng)頁,是搜索引擎的重要組成。python的urllib/urllib2等模塊很容易實(shí)現(xiàn)這一功能,下面的例子實(shí)現(xiàn)的是對(duì)baidu首頁的下載。具體代碼如下:
6.2 提交表單數(shù)據(jù)
(1)用GET方法提交數(shù)據(jù)
提交表單的GET方法是把表單數(shù)據(jù)編碼至URL。在給出請(qǐng)示的頁面后,加上問號(hào),接著是表單的元素。如在百度中搜索“馬伊
主站蜘蛛池模板:
独山县|
高尔夫|
尖扎县|
永和县|
黔南|
华阴市|
湖南省|
玉树县|
甘谷县|
克山县|
吉林市|
福州市|
神池县|
台中县|
仁怀市|
宜黄县|
台东市|
鄢陵县|
梁河县|
平度市|
郧西县|
哈密市|
呼和浩特市|
怀集县|
沙田区|
新泰市|
柘城县|
镇赉县|
吉安市|
峨眉山市|
井陉县|
板桥市|
广东省|
涟水县|
宽甸|
龙门县|
从化市|
红原县|
萨嘎县|
东丽区|
孟村|