国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 學院 > 開發設計 > 正文

提取網頁特定數據的案例

2019-11-14 09:47:13
字體:
來源:轉載
供稿:網友

BeautifulSoup可以使我們通過網頁的標簽找到網頁中我們想要的特定數據。本案例可以清楚地理順從html文件變化到我們想要獲得的數據。Python程序如下:

from bs4 import BeautifulSoupimport requestsurl = 'http://new.cpc.com.tw/division/mb/oil-more4.aspx'html = requests.get(url).textbs = BeautifulSoup(html, 'html.parser')#PRint(bs)data = bs.find_all('span' ,{'id':'Showtd'} )#print(data)rows = data[0].find_all('tr')#print(rows)prices = list()i = 0for row in rows:    if i < 16:        print(row)    cols = row.find_all("td")    if len(cols[1].text ) > 0:        item = [cols[0].text, cols[1].text, cols[2].text, cols[3].text]        prices.append(item)    i += 1i = 0for p in prices:    if i < 16:        print(p)    i += 1現在從變量容器的變化過程,認識提取特定數據的步驟:

通過BeautifulSoup(html, 'html.parser'),把html文件包裝為可以解析的對象,該對象對應的文本文件(部分內容)是:2.操作可解析的對象sb,通過find_all('span',{'id':'Showtd'}),把標簽<span></span>的內容找出來,形成數據表:3.再從上面的數據表中,找出標簽<tr></tr>表示的項,組成如下表:4.對上表的每個表項<td></td>再進行提取,得到最終數據:


上一篇:Subsets II

下一篇:Add Two Numbers

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 白玉县| 牟定县| 乌兰察布市| 临洮县| 沅陵县| 奉化市| 威信县| 南京市| 特克斯县| 秦皇岛市| 泽库县| 邵武市| 阳泉市| 临邑县| 清原| 滕州市| 尼勒克县| 张掖市| 建平县| 淄博市| 洛川县| 禄劝| 漳浦县| 木兰县| 南阳市| 菏泽市| 钟祥市| 海丰县| 长葛市| 文成县| 姚安县| 土默特左旗| 岳阳市| 卓资县| 德江县| 吉木乃县| 南木林县| 达尔| 三穗县| 延川县| 黄冈市|