国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 學院 > 開發設計 > 正文

2.IKAnalyzer 中文分詞器配置和使用

2019-11-17 01:36:12
字體:
來源:轉載
供稿:網友

2.IKAnalyzer 中文分詞器配置和使用

一、配置

IKAnalyzer中文分詞器配置,簡單,超簡單。

IKAnalyzer中文分詞器下載,注意版本問題,貌似出現向下不兼容的問題,solr的客戶端界面Logging會提示錯誤。

給出我配置成功的版本IKAnalyzer2012FF_hf1(包含源碼和中文使用手冊),我的solr是4.7的,當然相應的Lucene也是4.7的,鏈接地址:

http://code.google.com/p/ik-analyzer/downloads/detail?name=IK%20Analyzer%202012FF_hf1.zip&can=2&q=谷歌,不過貌似已經不能下載了,國內封殺了谷歌,tmd真蛋疼。

http://down.51cto.com/data/89463851CTO上面的,有賬號有積分的支持一下吧,我也是從人家那里下載的。

百度網盤,我自己共享的,時間久了就不一定還存在。鏈接:http://pan.baidu.com/s/1bngYiKZ密碼:g7dp

廢話少說,下載后文件夾里至少有IKAnalyzer.cfg.xml、IKAnalyzer2012FF_u1.jar、stopWord.dic,只需要配置這三個東西。

把IKAnalyzer2012FF_u1.jar拷貝到Tomcat的安裝目錄,我的是C:/apache-tomcat-8.0.8/webapps/solr/WEB-INF/lib/,把IKAnalyzer.cfg.xml、stopword.dic拷貝到C:/apache-tomcat-8.0.8/webapps/solr/WEB-INF/classes/,classes目錄沒有的話自行創建。

現在IKAnalyzer中文分詞器已經配置好了,是不是超簡單,不要把目錄搞錯了就可以了。

二、使用

現在說使用,在你的scheme.xml配置(不清楚什么是scheme.xml,請移步到上一篇博客看看)文件找到<types></types>在中間加入

<!--IKAnalyzer分詞器-->

<fieldTypename="text_IKFENCHI"class="solr.TextField">

<analyzertype="index"isMaxWordLength="false"class="org.wltea.analyzer.lucene.IKAnalyzer"/>

<analyzertype="query"isMaxWordLength="true"class="org.wltea.analyzer.lucene.IKAnalyzer"/>

</fieldType>

然后在<fields>節點下增加一個節點:

<fieldname="

注意field節點type里面的內容就是上面配置的fieldType,上面當于定義一個類,下面相當于用這個類定義一個變量。

這時你的PRODUCTNAME域就是通過IKAnalyzer分詞器分詞器進行分詞的了。

現在我們來solr客戶端界面測試一下分詞器。重啟一下Tomcat服務,打開http://localhost:8080/solr/#/

在這里找到我們的core,這里是可以配置多個core的,怎么配置后面再說,其實非常簡單。這個core我也不知道叫什么(內核?核心?),但可以打個比方,比如你做電商搜索系統,你可以搜索商品,可以搜索店鋪,那么你可以配置兩個core,分別對應商品和店鋪,這樣你可以在不同的core下的配置文件里配置不同的field等,這是我暫時這樣理解,有錯誤幫忙指正一下。這個不理解不要緊,后面我還有一系列的博客會說清楚。

這里默認是有一個叫collection1的,如果你剛才分詞器配錯了,這里可能就什么都沒有了哦,這時可以看一下Logging是不是有錯誤日志,找到后點擊下面的Analysis,在下拉框找到剛才配置的PRODUCTNAME

其實認真觀察的話,會發現這個下拉框里面是有分類的,分成了Fields和Types,這個PRODUCTNAME在Fields節點下,還可以找到text_IKFENCHI在Types下,其實就是對應剛才配置的scheme.xml,選擇其中一個都可以進行分詞測試,我們可以在FieldValue文本框里面輸入一段話,點擊AnayseValues按鈕,就會顯示分詞結果。

至于分出的結果是什么意思,可以自行深入研究吧,后面如果我學到了再補充。


發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 梅州市| 荥经县| 武义县| 双柏县| 黄陵县| 夏津县| 东宁县| 朔州市| 芷江| 慈利县| 阿拉善左旗| 扶余县| 浦县| 新竹县| 修武县| 栖霞市| 罗甸县| 本溪| 鹿泉市| 金平| 阿图什市| 宁津县| 和林格尔县| 封丘县| 济南市| 英德市| 容城县| 公主岭市| 舒兰市| 奉新县| 英山县| 姚安县| 马边| 会东县| 宣威市| 锡林浩特市| 龙游县| 合肥市| 东至县| 浏阳市| 桓仁|