国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 數據庫 > MySQL > 正文

mysql中使用sphinx搜索子域名需注意的問題

2020-01-18 23:49:19
字體:
來源:轉載
供稿:網友

搜索子域名

比如搜索VeVB.COm會把m.survivalescaperooms.com、VeVB.COm、host.VeVB.COm等都搜索出來。

如果使用mysql用like的話效率是非常低的,幾百萬甚至上千萬的數據那是沒有辦法使用的,于是采取sphinx來做。

在使用的過程中發現了諸多問題,這里將其總結起來,也讓不知道的朋友注意下這些字符。

分析:
sphinx是全文索引,它搜索的是包含的記錄。

首先如果我們不做任何設置的話,搜索VeVB.COm會出現把aaVeVB.COm、jb51.a.cn、VeVB.COm.com(當然這個域名后綴不存在,但是會有符合相應規則的域名,這里只舉例)等等。

為什么會出現這種情況呢?

我們使用./search -c 配置文件 -i 索引名 'VeVB.COm' 搜索的時候會發現下面words部分被分成了兩部分'jb51'和'cn',默認以.作為分隔符,如果我們不想讓它做為分隔符,就需要把.添加到charset_table里面,這里需要說的是我們搜索域名只需要有字母、數字、"-"等字符,其他的不需要。設置如下:
charset_table = 0..9,A..Z->a..z, a..z,U+002e,U+002d,U+0040,U+0060  #其中U+002e代表".",U+002d代表"-",U+0040代表"@",U+0060代表"`",這里為ascii碼值。
這樣會解決掉搜出jb51.a.cn這類域名。

那么VeVB.COm.com這類呢?我們可以在索引的字段中增加惟一后綴比如“XXXXX”,concat(search,'XXXXX')這樣,就不會出來了。

現在就剩下aaVeVB.COm這類域名,我們使用關鍵字“ '".VeVB.COm"' ”(注意是單引號里面套雙引號)這樣來搜索,主域名單獨加上,但是使用的過程中發現這樣搜出了與這個域名無關的域名,比如aa.bb.cn這樣,經后來研究是"."的問題,后來把"."替換成"@",來搜索又出現12306等好多域名無法讀取到的問題,后來經研究估計這些特殊字符在sphinx中都有特殊的意義,于是找到了"`"這個字符,換成這個以后一切才算正常了。

注意:將"."替換成"`"等相應字符后需在charset_table里增加這個字符,不然是被忽略的。

所以在搜索的過程中我們需要注意下這些特殊字符。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 安西县| 白银市| 韶山市| 甘孜| 扶风县| 富锦市| 惠水县| 高唐县| 楚雄市| 板桥市| 海门市| 莱州市| 大安市| 桂阳县| 灵山县| 黄冈市| 利川市| 临邑县| 临猗县| 开阳县| 黄石市| 仪陇县| 延安市| 金乡县| 威信县| 中宁县| 海淀区| 雷山县| 思南县| 马尔康县| 鹿泉市| 广灵县| 七台河市| 湘潭市| 娄烦县| 格尔木市| 清流县| 吉水县| 柘城县| 冕宁县| 宜章县|