本文實例講述了Python中文分詞實現方法。分享給大家供大家參考,具體如下:
在Python這pymmseg-cpp 還是十分方便的!
環境 ubuntu10.04 , python2.65
步驟:
1 下載mmseg-cpp的源代碼 http://code.google.com/p/pymmseg-cpp/
2 執行:
tar -zxf pymmseg-cpp*.tar.gz //解壓后得到pymmseg 目錄cd pymmseg/mmseg-cpppython build.py #生成 mmseg.so文件
3 將 pymmseg 目錄復制到 /usr/local/lib/python2.6/dist-packages 中
4 測試有沒有成功:
test.py文件:
from pymmseg import mmsegmmseg.dict_load_defaults()text = '今天的天氣真好啊,我們一起出去玩一下吧'algor = mmseg.Algorithm(text)for tok in algor: print '%s [%d..%d]' % (tok.text, tok.start, tok.end)
更多關于Python相關內容感興趣的讀者可查看本站專題:《Python圖片操作技巧總結》、《Python數據結構與算法教程》、《Python Socket編程技巧總結》、《Python函數使用技巧總結》、《Python字符串操作技巧匯總》、《Python入門與進階經典教程》及《Python文件與目錄操作技巧匯總》
希望本文所述對大家Python程序設計有所幫助。
新聞熱點
疑難解答
圖片精選