国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

Python爬蟲包BeautifulSoup異常處理(二)

2020-02-15 21:53:38
字體:
來源:轉載
供稿:網(wǎng)友

面對網(wǎng)絡不穩(wěn)定,頁面更新等問題,很可能出現(xiàn)程序異常的問題,所以我們要對程序進行一些異常處理。大家可能覺得處理異常是一個比較麻煩的活,但在面對復雜網(wǎng)頁和任務的時候,無疑成為一個很好的代碼習慣。

網(wǎng)頁‘404'、‘500'等問題

try:    html = urlopen('http://www.pmcaff.com/2221')  except HTTPError as e:    print(e)

返回的是空網(wǎng)頁

if html is None:    print('沒有找到網(wǎng)頁')

目標標簽在網(wǎng)頁中缺失

try:    #不存在的標簽    content = bsObj.nonExistingTag.anotherTag   except AttributeError as e:    print('沒有找到你想要的標簽')  else:    if content == None:      print('沒有找到你想要的標簽')    else:      print(content)

實例

if sys.version_info[0] == 2:  from urllib2 import urlopen # Python 2  from urllib2 import HTTPErrorelse:  from urllib.request import urlopen # Python3  from urllib.error import HTTPErrorfrom bs4 import BeautifulSoupimport sysdef getTitle(url):  try:    html = urlopen(url)  except HTTPError as e:    print(e)    return None  try:    bsObj = BeautifulSoup(html.read())    title = bsObj.body.h1  except AttributeError as e:    return None  return titletitle = getTitle("http://www.pythonscraping.com/exercises/exercise1.html")if title == None:  print("Title could not be found")else:  print(title)

以上全部為本篇文章的全部內容,希望對大家的學習有所幫助,也希望大家多多支持武林站長站。

發(fā)表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發(fā)表
主站蜘蛛池模板: 东源县| 清涧县| 屏东市| 曲松县| 崇信县| 广南县| 仙居县| 蓝山县| 米脂县| 盐津县| 谢通门县| 永昌县| 商都县| 鸡东县| 敖汉旗| 民权县| 闵行区| 台东市| 石首市| 伊春市| 视频| 揭阳市| 宾阳县| 浦城县| 都江堰市| 瑞昌市| 宁海县| 大荔县| 商洛市| 宁强县| 双辽市| 婺源县| 牟定县| 富蕴县| 新疆| 荆州市| 曲周县| 黎平县| 宁海县| 长宁县| 清水河县|