国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

Python正則抓取新聞標題和鏈接的方法示例

2019-11-25 16:13:58
字體:
來源:轉載
供稿:網(wǎng)友

本文實例講述了Python正則抓取新聞標題和鏈接的方法。分享給大家供大家參考,具體如下:

#-*-coding:utf-8-*-import refrom urllib import urlretrievefrom urllib import urlopen#獲取網(wǎng)頁信息doc = urlopen("http://www.itongji.cn/news/").read() #自己找的一個大數(shù)據(jù)的新聞網(wǎng)站#抓取新聞標題和鏈接def extract_title(info):  pat = '<h3><a target=/"_blank/"(.*?)</a></h3>'  title = re.findall(pat, info)  titles='/n'.join(title)  #print titles#修改指定字符串  titles1=titles.replace('class="title"','title')  titles2=titles1.replace('>',':')  titles3=titles2.replace('href','url:')  titles4=titles3.replace('="/','"http://www.itongji.cn/')#寫入文件  save=open('xinwen.txt','w')  save.write(titles4)  save.close()titles = extract_title(doc)

PS:這里再為大家提供2款非常方便的正則表達式工具供大家參考使用:

JavaScript正則表達式在線測試工具:
http://tools.VeVB.COm/regex/javascript

正則表達式在線生成工具:
http://tools.VeVB.COm/regex/create_reg

更多關于Python相關內容可查看本站專題:《Python正則表達式用法總結》、《Python數(shù)據(jù)結構與算法教程》、《Python Socket編程技巧總結》、《Python函數(shù)使用技巧總結》、《Python字符串操作技巧匯總》、《Python入門與進階經典教程》及《Python文件與目錄操作技巧匯總

希望本文所述對大家Python程序設計有所幫助。

發(fā)表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發(fā)表
主站蜘蛛池模板: 房产| 平武县| 惠东县| 南宁市| 类乌齐县| 九龙县| 天峻县| 包头市| 高平市| 康平县| 电白县| 饶平县| 鄢陵县| 乐清市| 东乌珠穆沁旗| 观塘区| 尼玛县| 永兴县| 汾阳市| 明水县| 三台县| 册亨县| 深水埗区| 洪江市| 永州市| 六安市| 凤凰县| 崇仁县| 鄢陵县| 浦江县| 莫力| 惠州市| 清水河县| 西安市| 鹤峰县| 通州区| 壶关县| 乐至县| 湛江市| 兖州市| 万州区|