国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 網站 > 優化推廣 > 正文

搜索引擎檢索系統概述

2024-04-26 13:54:07
字體:
來源:轉載
供稿:網友

前面簡要介紹過了搜索引擎的索引系統,實際上在建立倒排索引的最后還需要有一個入庫寫庫的過程,而為了提高效率這個過程還需要將全部term以及偏移量保存在文件頭部,并且對數據進行壓縮,這涉及到的過于技術化在此就不多提了。今天簡要給大家介紹一下索引之后的檢索系統。

檢索系統主要包含了五個部分,如下圖所示:

搜索引擎檢索系統概述_www.cuoXin.com

(1)Query串切詞分詞即將用戶的查詢詞進行分詞,對之后的查詢做準備,以“10號線地鐵故障”為例,可能的分詞如下(同義詞問題暫時略過):

10 0x123abc

號 0x13445d

線 0x234d

地鐵 0x145cf

故障 0x354df

(2)查出含每個term的文檔集合,即找出待選集合,如下:

0x123abc 1 2 3 4 7 9…..

0x13445d 2 5 8 9 10 11……

……

……

(3)求交,上述求交,文檔2和文檔9可能是我們需要找的,整個求交過程實際上關系著整個系統的性能,這里面包含了使用緩存等等手段進行性能優化;

(4)各種過濾,舉例可能包含過濾掉死鏈、重復數據、色情、垃圾結果以及你懂的;

(5)最終排序,將最能滿足用戶需求的結果排序在最前,可能包括的有用信息如:網站的整體評價、網頁質量、內容質量、資源質量、匹配程度、分散度、時效性等等,之后會詳細給大家介紹。

來源:seo優化網 轉載注明出處!

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 福贡县| 平谷区| 黑龙江省| 莲花县| 杭锦旗| 筠连县| 孝感市| 涟水县| 青浦区| 阳高县| 繁昌县| 舒兰市| 哈巴河县| 环江| 青川县| 连云港市| 义乌市| 富川| 平陆县| 浮梁县| 手游| 东辽县| 民权县| 武冈市| 高密市| 沙坪坝区| 吉首市| 资溪县| 龙岩市| 浙江省| 视频| 长葛市| 武义县| 黄陵县| 巢湖市| 巨野县| 琼海市| 利川市| 武穴市| 瑞安市| 二手房|