国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

Python正則表達式匹配中文用法示例

2019-11-25 16:24:06
字體:
來源:轉載
供稿:網友

本文實例講述了Python正則表達式匹配中文用法。分享給大家供大家參考,具體如下:

#!/usr/bin/python#-*- coding:cp936-*-#思路,將str轉換成unicode,方可用正則表達式,前提是,要知道文件的編碼,本例中是gbkimport cPickle as mypickleimport reimport sysif (__name__=='__main__'):  fid1=file('demo.txt','r');#demo.txt寫入字符如:武林網  p=re.compile('(^/s+|/s+$)');  phanzigbk=re.compile('[//x20-//x7f]');  phanzi=re.compile(u'[/u4e00-/u9fa5]');#這里要加u,注意  commlines=fid1.readlines();  fid1.close();  dictfamilyname={};  dictfirstname={};  for line in commlines:    line=p.sub('',line);    print type(line);    print line;    uline=unicode(line,'gbk');    print type(uline);    candidates=phanzi.findall(uline);    print len(candidates);    if(len(candidates)==2):      print candidates[0];      familynamegbk=candidates[0].encode('gbk');#把unicode型的變量變成str型的變量      firstnamegbk=candidates[1].encode('gbk');      if(dictfamilyname.has_key(familynamegbk)):        dictfamilyname[familynamegbk]=dictfamilyname[familynamegbk]+1;      else:        dictfamilyname[familynamegbk]=1;      if(dictfirstname.has_key(firstnamegbk)):        dictfirstname[firstnamegbk]=dictfirstname[firstnamegbk]+1;      else:        dictfirstname[firstnamegbk]=1;  familynameitems=dictfamilyname.items();  print familynameitems;  firstnameitems=dictfirstname.items();  familynameitems.sort(key=lambda d:d[1],reverse=True);  firstnameitems.sort(key=lambda d :d[1],reverse=True);  fid=file('familyname.txt','w');  for m in familynameitems:    s=m[0]+'/t'+str(m[1]);    fid.write(s);    fid.write('/n');  fid.close();  fid=file('firstname.txt','w');  for m in firstnameitems:    s=m[0]+'/t'+str(m[1]);    fid.write(s);    fid.write('/n');  fid.close();  print 'finish'

運行效果圖如下:

PS:這里再為大家提供2款非常方便的正則表達式工具供大家參考使用:

JavaScript正則表達式在線測試工具:
http://tools.VeVB.COm/regex/javascript

正則表達式在線生成工具:
http://tools.VeVB.COm/regex/create_reg

更多關于Python相關內容可查看本站專題:《Python正則表達式用法總結》、《Python數據結構與算法教程》、《Python Socket編程技巧總結》、《Python函數使用技巧總結》、《Python字符串操作技巧匯總》、《Python入門與進階經典教程》及《Python文件與目錄操作技巧匯總

希望本文所述對大家Python程序設計有所幫助。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 石景山区| 新民市| 大庆市| 榆林市| 叶城县| 南召县| 开封市| 康乐县| 遂平县| 冕宁县| 交口县| 张家界市| 龙里县| 新平| 屯留县| 勃利县| 方山县| 聂荣县| 镇原县| 龙州县| 太湖县| 军事| 呼图壁县| 泸水县| 项城市| 永靖县| 宁晋县| 襄樊市| 罗江县| 阿图什市| 丽水市| 龙井市| 聂荣县| 汝阳县| 兴隆县| 曲靖市| 盐山县| 农安县| 济宁市| 渝北区| 双鸭山市|