国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

python抓取京東商城手機列表url實例代碼

2019-11-25 18:35:30
字體:
來源:轉載
供稿:網友

復制代碼 代碼如下:

#-*- coding: UTF-8 -*-
'''
Created on 2013-12-5

@author: good-temper
'''

import urllib2
import bs4
import time

def getPage(urlStr):
    '''
                獲取頁面內容
    '''
    content = urllib2.urlopen(urlStr).read()
    return content

def getNextPageUrl(currPageNum):
    #http://list.jd.com/9987-653-655-0-0-0-0-0-0-0-1-1-頁碼-1-1-72-4137-33.html
    url =  u'http://list.jd.com/9987-653-655-0-0-0-0-0-0-0-1-1-'+str(currPageNum+1)+'-1-1-72-4137-33.html'

    #是否有下一頁
    content = getPage(url);
    soup = bs4.BeautifulSoup(content)
    list = soup.findAll('span',{'class':'next-disabled'});
    if(len(list) == 0):
        return url
    return ''

def analyzeList():
    pageNum = 0
    list = []
    url = getNextPageUrl(pageNum)
    while url !='':
        soup = bs4.BeautifulSoup(getPage(url))
        pagelist = soup.findAll('div',{'class':'p-name'})
        for elem in pagelist:
            soup1 =  bs4.BeautifulSoup(str(elem))
            list.append(soup1.find('a')['href'])

        pageNum = pageNum+1
        print pageNum
        url = getNextPageUrl(pageNum)
    return list

def analyzeContent(url):

    return ''

def writeToFile(list, path):
    f = open(path, 'a')
    for elem in list:
        f.write(elem+'/n')
    f.close()

if __name__ == '__main__':
    list = analyzeList()
    print '共抓取'+str(len(list))+'條/n'

    writeToFile(list, u'E://jd_phone_list.dat');

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 隆化县| 南昌市| 马尔康县| 虞城县| 雅江县| 泾川县| 余干县| 阜新市| 民乐县| 杭州市| 丰城市| 宾阳县| 舞钢市| 当涂县| 桐乡市| 娄烦县| 棋牌| 勐海县| 饶河县| 灯塔市| 阳西县| 万安县| 四平市| 惠东县| 丰顺县| 扎赉特旗| 永济市| 苍山县| 定陶县| 攀枝花市| 尉犁县| 贡山| 孟村| 八宿县| 安仁县| 南靖县| 北碚区| 阿瓦提县| 永泰县| 南澳县| 资中县|