国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 學院 > 開發設計 > 正文

solr5.3 實現同義詞 擴展詞典 停止詞典 功能介紹

2019-11-08 00:05:55
字體:
來源:轉載
供稿:網友

  配置同義詞首 擴展詞典 停止詞典等功能 先是要基于中文分詞的基礎上進行的,如果檢索關鍵詞不能夠進行中文分詞那么是查詢不到相關的同義詞的(配置中文分詞可參考:點擊打開鏈接)

  在進行配置前需要先下載下修改后的IK分詞jar包:IK分詞jar

找到solrhome中schema.xml文件進行添加如下配置:

 <fieldType name="text_ik" class="solr.TextField">     <analyzer type="query">     	<tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false"/>     	<filter class="solr.LowerCaseFilterFactory"/>     </analyzer>     <analyzer type="index">    	<tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="fasle"/>   	<filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true" />  	<filter class="solr.LowerCaseFilterFactory"/>     </analyzer>  </fieldType>        在schema.xml文件中添加一個字段并且引用text_ik分詞:

   <field name="content" type="text_ik" indexed="true" stored="true" multiValued="false" />完成配置之后保存 

下面我們就需要添加一下我們同義詞進行測試下是否成功

在schema.xml同級目錄下有synonyms.txt 這個文件夾 我們配置的同義詞就在這個文件中

格式 ,好隔開  一行為一個同義詞 保存 啟動服務 到admin頁面查看效果

下面說下擴展詞典和停止詞典的配置

解壓剛才下載的jar包 將 ext.dic  IKAnalyzer.cfg.xml  stopWord.dic 三個文件復制到

將上面復制的三個文件粘貼到apache-tomcat-7.0.47/webapps/solr/WEB-INF/classes目錄下

為修改ext.dic 如果

編輯ext.dic文件添加我們要擴展的詞匯例如:河北廊坊(格式一行為一個詞組)

添加之后 保存 重新啟動服務如圖 : 河北廊坊已經成為一次詞組出現

注: 如果編輯ext.dic時候未出現效果 需要將ext.dic格式設置為UTF-8格式

擴展的停止詞匯同理配置

停止詞匯含義:編輯到 stopword.dic 文件中的詞匯  在搜索的時候不會以詞組的形式出現

例如:麻痹  這個詞組放到了stopword.dic 中  在搜索時 麻痹 這個詞就不會在出現了


發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 康马县| 合川市| 灵璧县| 县级市| 博野县| 改则县| 赣榆县| 云霄县| 固原市| 卓尼县| 五河县| 嘉义市| 乌兰察布市| 高雄县| 鸡泽县| 临桂县| 霍林郭勒市| 乐昌市| 大港区| 泗阳县| 略阳县| 清涧县| 彭泽县| 大城县| 丰宁| 巩义市| 老河口市| 五华县| 衡水市| 凌海市| 宁远县| 察哈| 开鲁县| 旌德县| 吉首市| 海林市| 佳木斯市| 永登县| 忻州市| 屯昌县| 北辰区|