本文實(shí)例講述了python實(shí)現(xiàn)去除下載電影和電視劇文件名中的多余字符的方法,是一個(gè)非常實(shí)用的技巧,分享給大家供大家參考。具體如下:
有時(shí)候我們討厭下載電影和電視劇文件名中的多余字符(如網(wǎng)址和廣告字樣),搞得文件名好長(zhǎng)!不便于查看,這時(shí)候就可以使用下面的Python代碼,自行修改即可.
具體實(shí)現(xiàn)代碼如下:
#!/usr/bin/env python # -*- coding: utf-8 -*- # Author: 吳徐平 # FileName: RefineFileName.py # Function: # 下載的電影電視文件名太長(zhǎng), # 常常含有多余的字符,如'中英雙字幕', # 可以使用本Python代碼去掉 # Using python 2.7.X,win xp sp3 import sys import os import re # 文件夾目錄列表 FileDirectoryList=[/ u"E://電視電影//都市俠盜.Leverage",/ u"E://電視電影//犯罪心理.Criminal.Minds",/ u"E://電視電影//海軍罪案調(diào)查處.NCIS",/ u"E://電視電影//警察世家.Blue.Bloods"/ ] #文件名開頭處是否需要添加的字符串 #不需要添加字符時(shí),留空(或空白)字符來表示 AddStringList=[/ u'Leverage',/ u'Criminal.Minds',/ u'NCIS.',/ u'Blue.Bloods.' ] # 文件名中必須去掉的字符 MustReplaceStringList=[/ u'都市俠盜',/ u'犯罪心理',/ u'海軍罪案調(diào)查處',/ u'警察世家',/ u'人人影視',/ u'SFiles',/ u'YYeTs',/ ] # 去掉所有不必要的字符 NewString=u''; # 自定義重命名文件的函數(shù) def RenameFileName(OldFileName,NewFileName): oldpath,oldfn = os.path.split(OldFileName) newpath,newfn = os.path.split(NewFileName) print(oldpath.encode('ascii','ignore')) os.rename(OldFileName, NewFileName) #print (oldfn.encode('ascii','ignore')+' --> '+newfn.encode('ascii','ignore')) #正則表達(dá)式替換,最多一次,忽略大小寫 def StringRegexReplace(pattern,repl,string): return re.sub(pattern, repl, string, count=1, flags=re.I) # 循環(huán)#硬盤的電影電視劇所有目錄下的文件 for FileDirectory in FileDirectoryList: FileNamesList=os.listdir(FileDirectory) # 循環(huán)重新命名文件 for filenamei in FileNamesList: # 首先去掉文件名中的空格字符 RefinedFileName=filenamei.replace(u' ',NewString) # 循環(huán)必須去掉的文件名列表 for MustReplaceString in MustReplaceStringList: RefinedFileName=RefinedFileName.replace(MustReplaceString,NewString) #去掉錄制信息 RefinedFileName=StringRegexReplace(u'(?<=[/./-_])[^.]*rip(?=[/./-_])','',RefinedFileName) RefinedFileName=StringRegexReplace(u'(?<=[/./-_])xvi[^.]*(?=[/./-_])','',RefinedFileName) #去掉分辨率 RefinedFileName=StringRegexReplace('/d{1,4}X/d{1,4}','',RefinedFileName) #去掉[*]里面的所有內(nèi)容 RefinedFileName=StringRegexReplace(u'/[.*/]','',RefinedFileName) #去掉網(wǎng)址 RefinedFileName=StringRegexReplace(u'www/..*/.((com)|(net)|(cn)|(org))','',RefinedFileName) #去掉字幕(組)的字樣 RefinedFileName=StringRegexReplace(u'(?<=[/./-_])[^.]*字幕組?','',RefinedFileName) #去掉出品和作品字樣 RefinedFileName=StringRegexReplace(u'(?<=[/./-_])[^.]*[出作]品','',RefinedFileName) #去掉開頭的點(diǎn).下劃線_連接符-等 RefinedFileName=StringRegexReplace(u'^[._/-]','',RefinedFileName) # 經(jīng)常出現(xiàn)兩個(gè)點(diǎn)以上,直接替換成一個(gè)點(diǎn) RefinedFileName=RefinedFileName.replace(u'...',u'.') RefinedFileName=RefinedFileName.replace(u'..',u'.') # 可以重新命名了 OldFileName=os.path.join(FileDirectory,filenamei) NewFileName=os.path.join(FileDirectory,RefinedFileName) RenameFileName(OldFileName,NewFileName) ####下面的代碼在文件頭添加字符串 #判斷是否已經(jīng)添加了字符串 def HasAddString(AddString0,FileNameString0): if (len(AddString0.strip())<1):#AddString0為空字符不需要再添加任何字符了 print('Empty AddString,No need to add to : '+ FileNameString0.encode('ascii','ignore')) return True else: AddString=AddString0.strip().lower() FileNameString=FileNameString0.strip().lower() if(len(FileNameString)<=len(AddString)): return False else: if(FileNameString[0:(len(AddString)-1)]==AddString[0:(len(AddString)-1)]): return True else: return False DirCounter=0; # 循環(huán)#硬盤的電影電視劇所有目錄下的文件 for FileDirectory in FileDirectoryList: FileNamesList=os.listdir(FileDirectory) AddString =AddStringList[DirCounter] DirCounter=DirCounter+1 # 循環(huán)重新命名文件 for filenamei in FileNamesList: #已經(jīng)加過的文件名不再添加字符了 if HasAddString(AddString,filenamei): print(filenamei.encode('ascii','ignore')+' : ALready Added Header String!') else: # 首先連接字符串 RefinedFileName=AddString+filenamei # 可以重新命名了 OldFileName=os.path.join(FileDirectory,filenamei) NewFileName=os.path.join(FileDirectory,RefinedFileName) RenameFileName(OldFileName,NewFileName) print(filenamei.encode('ascii','ignore')+' : Add Header String, OK!') 對(duì)文件名的修改有特殊要求的,可以將StringRegexReplace函數(shù)用上.
運(yùn)行本文實(shí)例后可以看到下面的電視劇文件名看起來就舒服多了:

希望本文所述實(shí)例對(duì)大家的Python程序設(shè)計(jì)能有所幫助。
新聞熱點(diǎn)
疑難解答
圖片精選