国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 數據庫 > MySQL > 正文

Mysql全文搜索match against的用法

2024-07-24 13:02:48
字體:
來源:轉載
供稿:網友
對于大的數據庫,將數據裝載到一個沒有 FULLTEXT 索引的表中,然后再使用 ALTER TABLE   (或 CREATE INDEX) 創建索引,這將是非常快的。將數據裝載到一個已經有 FULLTEXT 索引的表中,將是非常慢的。
1.使用Mysql全文檢索fulltext的先決條件
    表的類型必須是MyISAM
建立全文檢索的字段類型必須是char,varchar,text

2.建立全文檢索先期配置
由于Mysql的默認配置是索引的詞的長度是4,所以要支持中文單字的話,首先更改這個.
*Unix用戶要修改my.cnf,一般此文件在/etc/my.cnf,如果沒有找到,先查找一下find / -name 'my.cnf'
在 [mysqld] 位置內加入:  
       ft_min_word_len     = 2
其它屬性還有
       ft_wordlist_charset = gbk
       ft_wordlist_file = /home/soft/mysql/share/mysql/wordlist-gbk.txt
       ft_stopword_file = /home/soft/mysql/share/mysql/stopwords-gbk.txt
稍微解釋一下:
       ft_wordlist_charset 表示詞典的字符集, 目前支持良好的有(UTF-8, gbk, gb2312, big5)
       ft_wordlist_file 是詞表文件, 每行包括一個詞及其詞頻(用若干制表符或空格分開,消岐專用)
       ft_stopword_file 表示過濾掉不索引的詞表, 一行一個.
       ft_min_word_len     加入索引的詞的最小長度, 缺省是 4, 為了支持中文單字故改為 2

3.建立全文檢索
在建表中用FullText關鍵字標識字段,已存在的表用 ALTER TABLE (或 CREATE INDEX) 創建索引
CREATE fulltext INDEX index_name ON table_name(colum_name);

4.使用全文檢索
    在SELECT的WHERE字句中用MATCH函數,索引的關鍵詞用AGAINST標識,IN BOOLEAN MODE是只有含有關鍵字就行,不用在乎位置,是不是起啟位置.
SELECT * FROM articles WHERE MATCH (tags) AGAINST ('旅游' IN BOOLEAN MODE);

5.詳細的說明請參數Mysql官方網站

這是Mysql 5.1的,不過4.X也可以做為參考,基本一置.我用的就是Mysql 4.1.

MySQL支持全文索引(Full-Text) 已經很久了,目前,fulltext是一種只適用于MyISAM表的一個索引類型,而且對定義索引列的數據類型也有限制,只能是以下三種的組合char、 varchar、text。fulltext可以在創建表的同時就一起定義好,或者在表創建完成之后,通過語句alter table或create index來追加索引,總之先后的效果是一樣的,但是兩者的效率卻是存在很大差異的,大量的實驗證明,對于大數量的表來說,先加載數據再來定義全文索引的 速度要遠遠優于在一個已經定義好全文索引的表里面插入大量數據的速度。一定會問:這是問什么呢?其實,道理很簡單,前者只需要一次性對你的索引列表進行操 作,排序比較都是在內存中完成,然后寫入硬盤;后者則要一條一條去硬盤中讀取索引表然后再進行比較最后寫入,自然這樣速度就會很慢。MySQL是 通過match()和against()這兩個函數來實現它的全文索引查詢的功能。match()中的字段名稱要和fulltext中定義的字段一致,如 果采用boolean模式搜索,也允許只包括fulltext中的某個字段,不需要全部列出。against()中定義的是所要搜索的字符串以及要求數據 庫通過哪種模式去執行全文索引的搜索查詢。下面通過一個例子分別介紹一下fulltext所支持的3中搜索模式。

MySQL全文索引與中文分詞總結及一般的關鍵詞搜索流程
?aid=4532

mysql 全文檢索 中文分詞

支持中文的MySQL 5.1+ 全文檢索分詞插件

家用一下搜索引擎就會發現,分詞的情況只是出現在當整詞命中為0的情況下。
而具體怎樣分詞,大家可以參考一下baidu搜索試驗結果:

·如果搜“徐祖寧寧”,結果為“徐祖”+“寧寧”。(搜人名的情況下,它可能有一個百家姓詞典,自動將姓后第一個字歸前)
·搜“徐寧愿”,結果為“徐寧愿”。(說明“寧愿”歸“徐”所有。同上。因為徐是姓。)
·搜“徐祖寧愿”,結果為“徐祖”+“寧愿”。(因為“寧愿”是詞,故“徐”只帶“祖”。)
·搜“徐祖寧高”,結果為“徐祖寧”。(因為“寧高”不是關鍵字,所以“寧”歸前詞所有。而“高”可能因為是單字,為提高前詞搜索效率故被省略。)

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 崇义县| 乌拉特前旗| 辉县市| 长治市| 板桥市| 泰兴市| 浦东新区| 延寿县| 苏尼特右旗| 宁德市| 禹州市| 都江堰市| 大宁县| 微山县| 高雄县| 五河县| 绥中县| 巴彦县| 丰台区| 杂多县| 安康市| 西峡县| 沈丘县| 隆子县| 龙岩市| 镇安县| 内江市| 阳曲县| 达州市| 启东市| 林西县| 科尔| 达孜县| 清原| 青龙| 汉川市| 安阳市| 工布江达县| 黑龙江省| 阿鲁科尔沁旗| 时尚|