本文代碼是使用python抓取京東小米8手機(jī)的配置信息
首先找到小米8商品的鏈接:https://item.jd.com/7437788.html
然后找到其配置信息的標(biāo)簽,我們找到其配置信息的標(biāo)簽為 <div class="Ptable">
然后再分析其配置信息的頁(yè)面的規(guī)律,我們發(fā)現(xiàn)都是dl中包含了dt和dd,而一個(gè)dt對(duì)應(yīng)的一個(gè)dd,dt對(duì)應(yīng)的是參數(shù),dd對(duì)應(yīng)的是參數(shù)具體的值
下面是源代碼
import requestsfrom bs4 import BeautifulSoupfrom pandas import Seriesfrom pandas import DataFrame response=requests.get("https://item.jd.com/7437788.html")html=response.text soup=BeautifulSoup(html,"html.parser")divSoup=soup.find("div",attrs={"class","Ptable"}) ##找到其配置信息的標(biāo)簽 data=DataFrame(columns=["參數(shù)","值"]) #定義一個(gè)二元的DataFramedls=divSoup.find_all("dl") for dl in dls: dts=dl.find_all("dt") dds=dl.find_all("dd") if len(dts)==len(dds): for i in range(len(dts)): f=dts[i].getText(); p=dds[i].getText(); data=data.append(Series([f,p],index=["參數(shù)","值"]),ignore_index=True);print(data)這是最終抓取到的配置信息,一共有64行,這里我就不一一列舉出來(lái)了
以上就是本文的全部?jī)?nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持VEVB武林網(wǎng)。
新聞熱點(diǎn)
疑難解答
圖片精選