国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 數(shù)據(jù)庫 > MySQL > 正文

MySQL中全文搜索詳解介紹

2024-07-24 12:38:28
字體:
供稿:網(wǎng)友

MySQL中的全文檢索是利用查詢關(guān)鍵字和查詢列內(nèi)容之間的相關(guān)度進(jìn)行檢索,可以利用全文索引來提高匹配的速度.

語法,代碼如下:

  1. MATCH (col1,col2,...) AGAINST (expr [search_modifier]) 
  2. search_modifier: { IN BOOLEAN MODE | WITH QUERY EXPANSION } 

例如:SELECT * FROM tab_name WHERE MATCH (col1,col2) AGAINST (search_word);

這里的table需要是MyISAM類型的表,col1、col2需要是char、varchar或text類型,在查詢之前需要在col1和col2上建立一個全文索引.

1.使用Mysql全文檢索fulltext的先決條件.

表的類型必須是MyISAM,建立全文檢索的字段類型必須是char,varchar,text.

2.建立全文檢索先期配置

由于Mysql的默認(rèn)配置是索引的詞的長度是4,所以要支持中文單字的話,首先更改這個.*Unix用戶要修改my.cnf,一般此文件在/etc/my.cnf,如果沒有找到,先查找一下find / -name 'my.cnf'

在 [mysqld] 位置內(nèi)加入::ft_min_word_len = 2 

其它屬性還有:

  1. ft_wordlist_charset = gbk  
  2. ft_wordlist_file = /home/soft/mysql/share/mysql/wordlist-gbk.txt  
  3. ft_stopword_file = /home/soft/mysql/share/mysql/stopwords-gbk.txt  

稍微解釋一下:

ft_wordlist_charset 表示詞典的字符集, 目前支持良好的有(UTF-8, gbk, gb2312, big5) 

ft_wordlist_file 是詞表文件, 每行包括一個詞及其詞頻(用若干制表符或空格分開,消岐專用) 

ft_stopword_file 表示過濾掉不索引的詞表, 一行一個. 

ft_min_word_len 加入索引的詞的最小長度, 缺省是 4, 為了支持中文單字故改為 2

3.建立全文檢索

在建表中用FullText關(guān)鍵字標(biāo)識字段,已存在的表用 ALTER TABLE (或 CREATE INDEX) 創(chuàng)建索引:

CREATE fulltext INDEX index_name ON table_name(colum_name);

4.使用全文檢索

在SELECT的WHERE字句中用MATCH函數(shù),索引的關(guān)鍵詞用AGAINST標(biāo)識,IN BOOLEAN MODE是只有含有關(guān)鍵字就行,不用在乎位置,是不是起啟位置.

SELECT * FROM articles WHERE MATCH (tags) AGAINST ('旅游' IN BOOLEAN MODE);

將向您講述在MySQL中如何進(jìn)行全文搜索.

1,設(shè)置基本表格

從創(chuàng)建例子表格開始,使用以下的SQL命令:

mysql> CREATE TABLE reviews (id INT(5) PRIMARY KEY NOT NULL AUTO_INCREMENT, data TEXT);

以上命令創(chuàng)建了一個簡單的音樂專集資料庫,主要是整段的文字,然后向這個表格中添加一些記錄:

  1. mysql> INSERT INTO `reviews` (`id`, `data`) VALUES 
  2.  
  3. (1, 'Gingerboy has a new single out called Throwing Rocks. It's great!'); 
  4.  
  5. mysql> INSERT INTO `reviews` (`id`, `data`) VALUES 
  6.  
  7. (2, 'Hello all, I really like the new Madonna single. 
  8.  
  9. One of the hottest tracks currently playing...I've been listening to it all day'); 
  10.  
  11. mysql> INSERT INTO `reviews` (`id`, `data`) 
  12.  
  13. VALUES (3, 'Have you heard the new band Hotter Than Hell? 
  14.  
  15. They have five members and they burn their instruments when they play in concerts. 
  16.  
  17. These guys totally rock! Like, awesome, dude!'); 

驗(yàn)證數(shù)據(jù)的正確錄入,代碼如下:

  1. mysql> SELECT * FROM reviews; 
  2.  
  3. +----+--------------------------------------------+ 
  4.  
  5. | id | data                                       | 
  6.  
  7. +----+--------------------------------------------+ 
  8.  
  9. |  1 | Gingerboy has a new single out called ...  | 
  10.  
  11. |  2 | Hello all, I really like the new Madon ... | 
  12.  
  13. |  3 | Have you heard the new band Hotter Than... | 
  14.  
  15. +----+--------------------------------------------+ 
  16.  
  17. rows in set (0.00 sec) 

2,定義全文搜索字段

接下來,定義您要作為全文搜索索引的字段,代碼如下:

  1. mysql> ALTER TABLE reviews ADD FULLTEXT INDEX (data); 
  2.  
  3. Query OK, 3 rows affected (0.21 sec) 
  4.  
  5. Records: 3  Duplicates: 0  Warnings: 0 

使用SHOW INDEXES命令來檢查索引已經(jīng)被添加了,代碼如下:

  1. mysql> SHOW INDEXES FROM reviews; 
  2.  
  3. +---------+---------------+--------+------+------------+---------+ 
  4.  
  5. Table   | Column_name   | Packed | Null | Index_type | Comment | 
  6.  
  7. ----------+---------------+--------+------+------------+---------+ 
  8.  
  9. | reviews |  id           | NULL   |      | BTREE      |         | 
  10.  
  11. | reviews |  data         | NULL   | YES  | FULLTEXT   |         | 
  12.  
  13. +---------+---------------+--------+------+------------+---------+ 
  14. --Vevb.com 
  15. rows in set (0.01 sec) 

3,運(yùn)行全文搜索

當(dāng)您擁有了數(shù)據(jù)和索引,就可以使用MySQL的全文搜索了,最簡單的全文搜索方式是帶有MATCH...AGAINST語句的SELECT查詢,以下是一個簡單的例子,可以來查找含有單詞“single”的記錄,代碼如下:

  1. mysql> SELECT id FROM reviews WHERE MATCH (data) AGAINST ('single');+----+ 
  2.  
  3. | id | 
  4.  
  5. +----+ 
  6.  
  7. |  1 | 
  8.  
  9. |  2 | 
  10.  
  11. +----+ 
  12.  
  13. rows in set (0.00 sec) 

在此,MATCH()將作為參數(shù)傳遞給它的字段中的文字與傳遞給AGAINST()的參數(shù)進(jìn)行比較,如果有匹配的,那就按照正常的方式返回。注意您可以傳遞不止一個字段用MATCH()來查看­-只需用逗號來分割字段列表。

當(dāng)MySQL收到了一個全文搜索的請求,它就在內(nèi)部對每個記錄進(jìn)行評分,不匹配的記錄得分為零,而“更相關(guān)”的記錄會得到比“不太相關(guān)”的記錄相對更高的分?jǐn)?shù),相關(guān)性是由MySQL的一系列區(qū)分標(biāo)準(zhǔn)來決定的,查看MySQL的用戶手冊可以得到更多的信息.

想看到每個記錄的評分如何,只需要返回MATCH()方法作為結(jié)果集的一部分,如下所示,代碼如下:

  1. mysql> SELECT id, MATCH (data) AGAINST ('rock'FROM reviews; 
  2.  
  3. +----+-------------------------------+ 
  4.  
  5. | id | MATCH (data) AGAINST ('rock') | 
  6.  
  7. +----+-------------------------------+ 
  8.  
  9. |  1 |                             0 | 
  10.  
  11. |  2 |                             0 | 
  12.  
  13. |  3 |               1.3862514533815 | 
  14.  
  15. +----+-------------------------------+ 
  16.  
  17. rows in set (0.00 sec) 

4,使用邏輯搜索修飾符,Boolean search modifiers.

您還可以使用邏輯搜索修飾符來進(jìn)行更精確的搜索,這通過在AGAINST語句中添加特殊的IN BOOLEAN MODE修飾符來實(shí)現(xiàn),在以下的例子中,將查找含有單詞“single”但是沒有“Madonna”的記錄,代碼如下:

  1. mysql> SELECT id FROM reviews WHERE MATCH (data) AGAINST ('+single -madonna' IN BOOLEAN MODE); 
  2.  
  3. +----+ 
  4.  
  5. | id | 
  6.  
  7. +----+ 
  8.  
  9. |  1 | 
  10.  
  11. +----+ 
  12.  
  13. 1 row in set (0.00 sec) 

這一搜索特性通常用于搜索單詞片斷,而不是完整的詞語,這可以通過在IN BOOLEAN MODE語句中的*(星號)操作符來實(shí)現(xiàn),以下的例子展示了如何查找單詞中含有“hot”的記錄,代碼如下:

  1. mysql> SELECT id FROM reviews WHERE MATCH (data) AGAINST ('hot*' IN BOOLEAN MODE);+----+ 
  2.  
  3. | id | 
  4.  
  5. +----+ 
  6.  
  7. |  3 | 
  8.  
  9. |  2 | 
  10.  
  11. +----+ 
  12.  
  13. rows in set (0.00 sec) 

您還可以使用這種方法來查找至少一個傳遞到AGAINST的參數(shù)中,以下的例子查找了至少包含單詞“hell”和“rocks”中的一個的記錄,代碼如下:

  1. mysql> SELECT id FROM reviews WHERE MATCH (data) AGAINST ('hell rocks' IN BOOLEAN MODE); 
  2.  
  3. +----+ 
  4.  
  5. | id | 
  6.  
  7. +----+ 
  8.  
  9. |  1 | 
  10.  
  11. |  3 | 
  12.  
  13. +----+ 
  14.  
  15. rows in set (0.00 sec) 

以上的這些例子演示了相對于傳統(tǒng)的SELECT...LIKE語句,進(jìn)行全文搜索的更有效的方法,當(dāng)您下一次需要編寫MySQL數(shù)據(jù)庫搜索界面的時候,您可以嘗試這一方法.

發(fā)表評論 共有條評論
用戶名: 密碼:
驗(yàn)證碼: 匿名發(fā)表
主站蜘蛛池模板: 辰溪县| 平远县| 英超| 鄢陵县| 水富县| 仙桃市| 海伦市| 定远县| 淮滨县| 云安县| 米易县| 太原市| 伊吾县| 晋城| 新泰市| 松溪县| 孟连| 工布江达县| 龙门县| 姚安县| 定兴县| 河南省| 黎平县| 凤翔县| 珠海市| 黄骅市| 敖汉旗| 太仓市| 长兴县| 洪湖市| 吴川市| 巴中市| 广灵县| 龙游县| 慈溪市| 昌吉市| 东乌珠穆沁旗| 读书| 广州市| 平陆县| 克拉玛依市|