国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

python正則表達式使用實例-替換字符串HTML標簽

2019-11-08 18:35:30
字體:
來源:轉載
供稿:網友

最近因為需要把字符串中的html標簽替換掉,想到的是使用正則來做,因為原來模塊是用C++碼的,所以就用的glibc的regex來做的。后來查資料發現用python來做這件事,簡單方便,而且一次性可以完成所有替換,不想用C還需要自己寫程序移動指針完成替換。不多說了上代碼,很簡單。

#! /usr/bin/env python # -*- coding:gbk -*- """ Notes: A python script that use regex to replace all the label of a html file """ import os import sys import re if __name__ == "__main__": input_file = sys.argv[1] with open(input_file, 'r') as fp: for line in fp: line = line.rstrip() pattern = re.compile(r'<([^>]*)>') match_list = pattern.findall(line) for i in range(0, len(match_list)): 輸入文件

helle<p>world</p><br/>

輸出結果

matched:pmatched:/pmatched:br/helleworld

這里說一下,Python的re模塊的findall函數返回的是正則模式里面組所匹配的內容,可以方便進一步使用。


發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 平远县| 东兰县| 法库县| 临猗县| 花垣县| 通榆县| 北京市| 德兴市| 吉林市| 肃北| 应用必备| 阜宁县| 三门县| 思茅市| 德昌县| 嫩江县| 华宁县| 垫江县| 苏尼特左旗| 玉溪市| 安岳县| 竹溪县| 柏乡县| 兴山县| 桂东县| 济宁市| 南昌市| 泸州市| 当阳市| 高邮市| 永靖县| 广宁县| 宝应县| 芦山县| 沭阳县| 达日县| 宁明县| 广南县| 青神县| 五家渠市| 瓦房店市|