国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁(yè) > 編程 > Python > 正文

python爬蟲(chóng)爬取網(wǎng)頁(yè)表格數(shù)據(jù)

2020-02-22 23:22:51
字體:
來(lái)源:轉(zhuǎn)載
供稿:網(wǎng)友

用python爬取網(wǎng)頁(yè)表格數(shù)據(jù),供大家參考,具體內(nèi)容如下

from bs4 import BeautifulSoup import requests import csv import bs4   #檢查url地址 def check_link(url):  try:      r = requests.get(url)   r.raise_for_status()   r.encoding = r.apparent_encoding   return r.text  except:   print('無(wú)法鏈接服務(wù)器!!!')   #爬取資源 def get_contents(ulist,rurl):  soup = BeautifulSoup(rurl,'lxml')  trs = soup.find_all('tr')  for tr in trs:   ui = []   for td in tr:    ui.append(td.string)   ulist.append(ui)   #保存資源 def save_contents(urlist):  with open("D:/2016年中國(guó)企業(yè)500強(qiáng)排行榜.csv",'w') as f:   writer = csv.writer(f)   writer.writerow(['2016年中國(guó)企業(yè)500強(qiáng)排行榜'])   for i in range(len(urlist)):    writer.writerow([urlist[i][1],urlist[i][3],urlist[i][5]]) def main():  urli = []  url = "http://www.maigoo.com/news/463071.html"  rs = check_link(url)  get_contents(urli,rs)  save_contents(urli)  main() 

以上就是本文的全部?jī)?nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持武林站長(zhǎng)站。

發(fā)表評(píng)論 共有條評(píng)論
用戶名: 密碼:
驗(yàn)證碼: 匿名發(fā)表
主站蜘蛛池模板: 长兴县| 兖州市| 武夷山市| 恭城| 黄浦区| 武冈市| 商城县| 图片| 辰溪县| 三亚市| 石林| 崇礼县| 老河口市| 卓资县| 淄博市| 昭平县| 巩留县| 内丘县| 阿克陶县| 龙陵县| 上饶县| 当雄县| 临沂市| 石阡县| 青河县| 新源县| 家居| 池州市| 谷城县| 隆林| 屯昌县| 信阳市| 丁青县| 罗源县| 满城县| 武强县| 东乡县| 纳雍县| 乌苏市| 东至县| 通化市|