国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁(yè) > 編程 > Python > 正文

python實(shí)現(xiàn)html轉(zhuǎn)ubb代碼(html2ubb)

2020-02-23 05:29:39
字體:
來(lái)源:轉(zhuǎn)載
供稿:網(wǎng)友

這兩天在用python寫一個(gè)采集器,有個(gè)功能模塊是html代碼轉(zhuǎn)換為ubb,網(wǎng)上貌似沒(méi)有現(xiàn)成程序,就自己寫了個(gè)函數(shù),順便鍛煉下自己的正則。

import redef Html2UBB(content):	#以下是將html標(biāo)簽轉(zhuǎn)為ubb標(biāo)簽	pattern = re.compile( '<a href=/"([sS]+?)/"[^>]*>([sS]+?)</a>',re.I)	content = pattern.sub(r'[url=1]2[/url]',content)	pattern = re.compile( '<img[^>]+src=/"([^/"]+)/"[^>]*>',re.I)	content = pattern.sub(r'[img]1[/img]',content)	pattern = re.compile( '<strong>([sS]+?)</strong>',re.I)	content = pattern.sub(r'[b]1[/b]',content)	pattern = re.compile( '<font color=/"([sS]+?)/">([sS]+?)</font>',re.I)	content = pattern.sub(r'[1]2[/1]',content)	pattern = re.compile( '<[^>]*?>',re.I)	content = pattern.sub('',content)	#以下是將html轉(zhuǎn)義字符轉(zhuǎn)為普通字符	content = content.replace('<','<')	content = content.replace('>','>')	content = content.replace('”','”')	content = content.replace('“','“')	content = content.replace('"','"')	content = content.replace('©','©')	content = content.replace('®','®')	content = content.replace(' ',' ')	content = content.replace('—','—')	content = content.replace('–','–')	content = content.replace('‹','‹')	content = content.replace('›','›')	content = content.replace('…','…')	content = content.replace('&','&')	return content

使用時(shí)直接調(diào)用Html2UBB函數(shù),返回值就是ubb碼了html轉(zhuǎn)ubb

發(fā)表評(píng)論 共有條評(píng)論
用戶名: 密碼:
驗(yàn)證碼: 匿名發(fā)表
主站蜘蛛池模板: 峨眉山市| 洪泽县| 乌兰察布市| 承德市| 菏泽市| 安龙县| 枣庄市| 虎林市| 碌曲县| 定远县| 庐江县| 凌云县| 内江市| 永兴县| 永州市| 页游| 诸暨市| 夏津县| 大宁县| 区。| 武平县| 同仁县| 元江| 福安市| 海丰县| 沙湾县| 闸北区| 台山市| 古浪县| 榆社县| 扬州市| 进贤县| 五常市| 饶河县| 兰坪| 浦城县| 县级市| 武隆县| 专栏| 东丽区| 布拖县|