国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

Python實現統計單詞出現的個數

2020-02-23 01:26:31
字體:
來源:轉載
供稿:網友

最近在看python腳本語言,腳本語言是一種解釋性的語言,不需要編譯,可以直接用,由解釋器來負責解釋。python語言很強大,而且寫起來很簡潔。下面的一個例子就是用python統計單詞出現的個數。

import sysimport string#import collectionsif len(sys.argv) == 1 or sys.argv[1] in {"-h", "--help"}: print("usage: uniqueword filename_1 filename_2 ... filename_n") sys.exit()else: words = {}  # words = collections.defaultdict(int) strip = string.whitespace + string.punctuation + string.digits + "/"'" for filename in sys.argv[1:]: for line in open(filename):  for word in line.split():  word = word.strip(strip)  if len(word) >= 2:   words[word] = words.get(word, 0) + 1   # words[word] += 1 for word in sorted(words): print("'{0}' occurs {1} times".format(word,words[word]))

假設文件名是 uniqueword.py,在命令行下輸入: uniqueword.py filename_1 filename_2 ... filename_n中單詞出現的次數可以被統計出來。
 
第四行和第五行判斷是否有輸入參數,如果輸入參數為空或者為-h, -help,則輸出幫助信息。

從第七行到第14行是核心部分,逐一打開參數中指定的文件,并讀取每一行,再用字符串的split方法把讀取的行抽取出一個一個的單詞,但單詞長度大于2的時候,把此單詞加入到字典words中。 其中words.get(word, 0)的意思是取出key等于word的value,如果key為空,則把value置為默認值0. 最后打印出結果。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 左权县| 邻水| 珠海市| 清镇市| 东丰县| 白水县| 榆林市| 政和县| 嘉善县| 平谷区| 当阳市| 黄山市| 岢岚县| 田东县| 遂昌县| 丰都县| 红河县| 永顺县| 禄劝| 尉氏县| 上杭县| 曲水县| 甘谷县| 手游| 罗平县| 瑞安市| 土默特右旗| 两当县| 唐海县| 龙川县| 丹凤县| 岗巴县| 伊宁市| 彭山县| 卓资县| 柳江县| 锡林郭勒盟| 奉新县| 岳西县| 稷山县| 泽普县|