国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 數據庫 > MySQL > 正文

mysql中使用sphinx搜索子域名需注意的問題

2024-07-24 13:01:22
字體:
來源:轉載
供稿:網友

搜索子域名

比如搜索vevb.com會把、vevb.com、host.vevb.com等都搜索出來。

如果使用mysql用like的話效率是非常低的,幾百萬甚至上千萬的數據那是沒有辦法使用的,于是采取sphinx來做。

在使用的過程中發現了諸多問題,這里將其總結起來,也讓不知道的朋友注意下這些字符。

分析:
sphinx是全文索引,它搜索的是包含的記錄。

首先如果我們不做任何設置的話,搜索vevb.com會出現把aavevb.com、jb51.a.cn、vevb.com.com(當然這個域名后綴不存在,但是會有符合相應規則的域名,這里只舉例)等等。

為什么會出現這種情況呢?

我們使用./search -c 配置文件 -i 索引名 'vevb.com' 搜索的時候會發現下面words部分被分成了兩部分'jb51'和'cn',默認以.作為分隔符,如果我們不想讓它做為分隔符,就需要把.添加到charset_table里面,這里需要說的是我們搜索域名只需要有字母、數字、"-"等字符,其他的不需要。設置如下:
charset_table = 0..9,A..Z->a..z, a..z,U+002e,U+002d,U+0040,U+0060 #其中U+002e代表".",U+002d代表"-",U+0040代表"@",U+0060代表"`",這里為ascii碼值。
這樣會解決掉搜出jb51.a.cn這類域名。

那么vevb.com.com這類呢?我們可以在索引的字段中增加惟一后綴比如“XXXXX”,concat(search,'XXXXX')這樣,就不會出來了。

現在就剩下aavevb.com這類域名,我們使用關鍵字“ '".vevb.com"' ”(注意是單引號里面套雙引號)這樣來搜索,主域名單獨加上,但是使用的過程中發現這樣搜出了與這個域名無關的域名,比如aa.bb.cn這樣,經后來研究是"."的問題,后來把"."替換成"@",來搜索又出現12306等好多域名無法讀取到的問題,后來經研究估計這些特殊字符在sphinx中都有特殊的意義,于是找到了"`"這個字符,換成這個以后一切才算正常了。

注意:將"."替換成"`"等相應字符后需在charset_table里增加這個字符,不然是被忽略的。

所以在搜索的過程中我們需要注意下這些特殊字符。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 沂南县| 阜新市| 蚌埠市| 祁连县| 武乡县| 星子县| 北海市| 石家庄市| 习水县| 双桥区| 高清| 博湖县| 博客| 扎囊县| 桃源县| 万载县| 柳林县| 延川县| 武安市| 乐至县| 时尚| 乌拉特中旗| 航空| 建宁县| 桓仁| 榆林市| 河源市| 连州市| 上杭县| 上饶县| 泰和县| 涟水县| 清苑县| 杂多县| 江安县| 全椒县| 蓬溪县| 天祝| 大兴区| 天祝| 岑溪市|