国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Java > 正文

java讀取英語文本,找出頻率最高的20個單詞

2019-11-06 07:17:23
字體:
來源:轉載
供稿:網友

利用集合類,其中按照map中value排列需要考慮一下具體思路,最后結合list完成排列

/** * Created by changqing on 2017/3/4. */import java.io.*;import java.util.*;public class test {    public static void main(String [] args) throws Exception {        System.out.PRintln("starting to read file");        File file=new File("test.txt");        BufferedReader bf=new BufferedReader(new FileReader(file));        String line;        String reg="//s+";//正則表達式,把句子劃分為一個個單詞        TreeMap<String,Integer> tm= new TreeMap<String, Integer>();        while((line=bf.readLine())!=null) {           String []strs=line.split(reg);            for(String str:strs)            {                str=str.replaceAll("[//p{Punct}//pP]", ""); //去掉單詞中含有的標點符號                if(!tm.containsKey(str))                {                    tm.put(str,1);                }                else                    tm.put(str,tm.get(str)+1);            }        }        List<Map.Entry<String,Integer>> list = new ArrayList<Map.Entry<String,Integer>>(tm.entrySet());        Collections.sort(list, new Comparator<Map.Entry<String, Integer>>() {            public int compare(Map.Entry<String, Integer> o1,                               Map.Entry<String, Integer> o2) {                return (o2.getValue() - o1.getValue());            }        });        for (int i = 0; i <20 ; i++) {            System.out.println(list.get(i).getKey());        }    }}


發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 台安县| 基隆市| 文成县| 长宁县| 兴隆县| 连州市| 江阴市| 普格县| 福清市| 南岸区| 修文县| 昭觉县| 台南市| 平昌县| 长沙市| 莆田市| 新闻| 澄江县| 台江县| 德江县| 清苑县| 宕昌县| 洪雅县| 四子王旗| 都安| 安吉县| 英山县| 视频| 江西省| 慈利县| 桃园县| 隆子县| 东乡族自治县| 旬邑县| 平安县| 三门峡市| 陆丰市| 页游| 延津县| 萨迦县| 吉木萨尔县|