MySQL中的全文檢索是利用查詢關(guān)鍵字和查詢列內(nèi)容之間的相關(guān)度進(jìn)行檢索,可以利用全文索引來提高匹配的速度.
語法,代碼如下:
- MATCH (col1,col2,...) AGAINST (expr [search_modifier])
- search_modifier: { IN BOOLEAN MODE | WITH QUERY EXPANSION }
例如:SELECT * FROM tab_name WHERE MATCH (col1,col2) AGAINST (search_word);
這里的table需要是MyISAM類型的表,col1、col2需要是char、varchar或text類型,在查詢之前需要在col1和col2上建立一個全文索引.
1.使用Mysql全文檢索fulltext的先決條件.
表的類型必須是MyISAM,建立全文檢索的字段類型必須是char,varchar,text.
2.建立全文檢索先期配置
由于Mysql的默認(rèn)配置是索引的詞的長度是4,所以要支持中文單字的話,首先更改這個.*Unix用戶要修改my.cnf,一般此文件在/etc/my.cnf,如果沒有找到,先查找一下find / -name 'my.cnf'
在 [mysqld] 位置內(nèi)加入::ft_min_word_len = 2
其它屬性還有:
- ft_wordlist_charset = gbk
- ft_wordlist_file = /home/soft/mysql/share/mysql/wordlist-gbk.txt
- ft_stopword_file = /home/soft/mysql/share/mysql/stopwords-gbk.txt
稍微解釋一下:
ft_wordlist_charset 表示詞典的字符集, 目前支持良好的有(UTF-8, gbk, gb2312, big5)
ft_wordlist_file 是詞表文件, 每行包括一個詞及其詞頻(用若干制表符或空格分開,消岐專用)
ft_stopword_file 表示過濾掉不索引的詞表, 一行一個.
3.建立全文檢索
在建表中用FullText關(guān)鍵字標(biāo)識字段,已存在的表用 ALTER TABLE (或 CREATE INDEX) 創(chuàng)建索引:
CREATE fulltext INDEX index_name ON table_name(colum_name);
4.使用全文檢索
在SELECT的WHERE字句中用MATCH函數(shù),索引的關(guān)鍵詞用AGAINST標(biāo)識,IN BOOLEAN MODE是只有含有關(guān)鍵字就行,不用在乎位置,是不是起啟位置.
SELECT * FROM articles WHERE MATCH (tags) AGAINST ('旅游' IN BOOLEAN MODE);
將向您講述在MySQL中如何進(jìn)行全文搜索.
1,設(shè)置基本表格
從創(chuàng)建例子表格開始,使用以下的SQL命令:
mysql> CREATE TABLE reviews (id INT(5) PRIMARY KEY NOT NULL AUTO_INCREMENT, data TEXT);
以上命令創(chuàng)建了一個簡單的音樂專集資料庫,主要是整段的文字,然后向這個表格中添加一些記錄:
- mysql> INSERT INTO `reviews` (`id`, `data`) VALUES
- (1, 'Gingerboy has a new single out called Throwing Rocks. It's great!');
- mysql> INSERT INTO `reviews` (`id`, `data`) VALUES
- (2, 'Hello all, I really like the new Madonna single.
- One of the hottest tracks currently playing...I've been listening to it all day');
- mysql> INSERT INTO `reviews` (`id`, `data`)
- VALUES (3, 'Have you heard the new band Hotter Than Hell?
- They have five members and they burn their instruments when they play in concerts.
- These guys totally rock! Like, awesome, dude!');
驗(yàn)證數(shù)據(jù)的正確錄入,代碼如下:
- mysql> SELECT * FROM reviews;
- +----+--------------------------------------------+
- | id | data |
- +----+--------------------------------------------+
- | 1 | Gingerboy has a new single out called ... |
- | 2 | Hello all, I really like the new Madon ... |
- | 3 | Have you heard the new band Hotter Than... |
- +----+--------------------------------------------+
- 3 rows in set (0.00 sec)
2,定義全文搜索字段
接下來,定義您要作為全文搜索索引的字段,代碼如下:
- mysql> ALTER TABLE reviews ADD FULLTEXT INDEX (data);
- Query OK, 3 rows affected (0.21 sec)
- Records: 3 Duplicates: 0 Warnings: 0
使用SHOW INDEXES命令來檢查索引已經(jīng)被添加了,代碼如下:
- mysql> SHOW INDEXES FROM reviews;
- +---------+---------------+--------+------+------------+---------+
- | Table | Column_name | Packed | Null | Index_type | Comment |
- ----------+---------------+--------+------+------------+---------+
- | reviews | id | NULL | | BTREE | |
- | reviews | data | NULL | YES | FULLTEXT | |
- +---------+---------------+--------+------+------------+---------+
- --Vevb.com
- 2 rows in set (0.01 sec)
3,運(yùn)行全文搜索
當(dāng)您擁有了數(shù)據(jù)和索引,就可以使用MySQL的全文搜索了,最簡單的全文搜索方式是帶有MATCH...AGAINST語句的SELECT查詢,以下是一個簡單的例子,可以來查找含有單詞“single”的記錄,代碼如下:
- mysql> SELECT id FROM reviews WHERE MATCH (data) AGAINST ('single');+----+
- | id |
- +----+
- | 1 |
- | 2 |
- +----+
- 2 rows in set (0.00 sec)
在此,MATCH()將作為參數(shù)傳遞給它的字段中的文字與傳遞給AGAINST()的參數(shù)進(jìn)行比較,如果有匹配的,那就按照正常的方式返回。注意您可以傳遞不止一個字段用MATCH()來查看-只需用逗號來分割字段列表。
當(dāng)MySQL收到了一個全文搜索的請求,它就在內(nèi)部對每個記錄進(jìn)行評分,不匹配的記錄得分為零,而“更相關(guān)”的記錄會得到比“不太相關(guān)”的記錄相對更高的分?jǐn)?shù),相關(guān)性是由MySQL的一系列區(qū)分標(biāo)準(zhǔn)來決定的,查看MySQL的用戶手冊可以得到更多的信息.
想看到每個記錄的評分如何,只需要返回MATCH()方法作為結(jié)果集的一部分,如下所示,代碼如下:
- mysql> SELECT id, MATCH (data) AGAINST ('rock') FROM reviews;
- +----+-------------------------------+
- | id | MATCH (data) AGAINST ('rock') |
- +----+-------------------------------+
- | 1 | 0 |
- | 2 | 0 |
- | 3 | 1.3862514533815 |
- +----+-------------------------------+
- 3 rows in set (0.00 sec)
4,使用邏輯搜索修飾符,Boolean search modifiers.
您還可以使用邏輯搜索修飾符來進(jìn)行更精確的搜索,這通過在AGAINST語句中添加特殊的IN BOOLEAN MODE修飾符來實(shí)現(xiàn),在以下的例子中,將查找含有單詞“single”但是沒有“Madonna”的記錄,代碼如下:
- mysql> SELECT id FROM reviews WHERE MATCH (data) AGAINST ('+single -madonna' IN BOOLEAN MODE);
- +----+
- | id |
- +----+
- | 1 |
- +----+
- 1 row in set (0.00 sec)
這一搜索特性通常用于搜索單詞片斷,而不是完整的詞語,這可以通過在IN BOOLEAN MODE語句中的*(星號)操作符來實(shí)現(xiàn),以下的例子展示了如何查找單詞中含有“hot”的記錄,代碼如下:
- mysql> SELECT id FROM reviews WHERE MATCH (data) AGAINST ('hot*' IN BOOLEAN MODE);+----+
- | id |
- +----+
- | 3 |
- | 2 |
- +----+
- 2 rows in set (0.00 sec)
您還可以使用這種方法來查找至少一個傳遞到AGAINST的參數(shù)中,以下的例子查找了至少包含單詞“hell”和“rocks”中的一個的記錄,代碼如下:
- mysql> SELECT id FROM reviews WHERE MATCH (data) AGAINST ('hell rocks' IN BOOLEAN MODE);
- +----+
- | id |
- +----+
- | 1 |
- | 3 |
- +----+
- 2 rows in set (0.00 sec)
以上的這些例子演示了相對于傳統(tǒng)的SELECT...LIKE語句,進(jìn)行全文搜索的更有效的方法,當(dāng)您下一次需要編寫MySQL數(shù)據(jù)庫搜索界面的時候,您可以嘗試這一方法.
新聞熱點(diǎn)
疑難解答
圖片精選