国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 數據庫 > SQL Server > 正文

深入探討SQL Server 2005噪聲字詞和辭典

2024-08-31 00:52:32
字體:
來源:轉載
供稿:網友
這篇論壇文章(賽迪網技術社區)詳細介紹了SQL Server 2005噪聲字詞和辭典的相關概念及背景知識,更多內容請參考下文:

問題:

我聽說全文搜索可以使用噪聲字詞來消除搜索過程中無意義的字詞。我還聽說全文搜索利用了辭典,但是不是很清楚實際是如何應用的。你可不可以詳細介紹這兩種技術是怎么樣應用到全文搜索中的?我很想知道這些全文搜索技術的背景知識,以及哪里可以獲取這些文件和如何升級這些文件。

解答:

盡管噪聲字詞和辭典在全文搜索執行方面有很多相似的地方,但是為了解釋的更為清楚,我們把這兩種技術分開來講。要記住雖然SQL Server 2000和7.0版本也有一些相同的屬性,但是本文中介紹的信息都適用于SQL Server 2005。你還需要關注SQL Server 2008的全文搜索功能的特點,因為新版本中部分規則有所變動。

噪聲字詞

目的:

microsoft建立噪聲字詞文件,在語言的基礎上決定哪些字詞對于搜索來說是無意義的。例如,在(美式)英語中,噪聲字詞可以包括:because、been、before、being、between、both、but等。在默認的Noiseenu.txt文件(美式英語)里,有100多個噪聲字詞,在進行全文搜索的時候會使用這個文件消除無意義的字詞。

語言支持:

系統支持20種不同的語言,從中文(Noisechs.txt)到土耳其語(Noisetrk.txt)。

windows 目錄:$SQL_Server_Install_Path/Microsoft sql server/MSSQL.1/MSSQL/FTDATA/

更改:

可以向文件里添加新的噪聲字詞。新噪聲字詞會添加到默認的最后一次登錄“your”后之后。

更多信息

如果你更改了噪聲字詞文件,在使用新噪聲字詞前,需要重新輸入所有的全文目錄。

辭典

目的:

能夠在全文搜索中確定并使用同義字詞。利用CONTAINS或CONTAINSTABLE命令指定FORMSOF THESAURUS參數,就可以使用辭典來確定搜索關鍵詞的同義詞。同樣也可以利用FREETEXT和FREETEXTTABLE命令。利用這些命令可以使用辭典來確定搜索關鍵詞的表達或替換詞。

語言支持:

辭典文件為xml格式文件,有一個總文件(tsGLOBAL.xml)和18個語言文件。默認設置中所有的文件都有注釋的XML樣例,因此在執行全文搜索時默認設置是不會建立同義詞的。

Windows目錄:

$SQL_Server_Install_Path/Microsoft sql server/MSSQL.1/MSSQL/FTDATA/

更改:

在檢查了XML格式之后,存在兩種辭典詞目類型。第一類為擴展類型,第二類為替代類型。擴展類型可以被認為時同義詞或替代詞。替代類型表明以一個字符串替代另一個字符串。

更多信息:

所有辭典文件都應該以Unicode形式保存。

要使用新的辭典,需要重新啟動全文搜索引擎窗口。


發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 淮北市| 于田县| 新乐市| 台前县| 习水县| 天峨县| 滦平县| 东平县| 崇信县| 汽车| 巴彦淖尔市| 贞丰县| 固阳县| 唐海县| 英超| 永城市| 湘潭市| 苏尼特左旗| 聂荣县| 凭祥市| 莱西市| 澄迈县| 周至县| 安西县| 曲沃县| 枣阳市| 乐山市| 湟中县| 忻州市| 台南市| 玛沁县| 和政县| 平原县| 长岛县| 沙田区| 历史| 祁门县| 卢湾区| 舞阳县| 临邑县| 蚌埠市|