您現在的位置: 网站首頁 / seo優化 / 正文

搜索引擎檢索系統概述

作者: admin 发布: 2013-10-28 22:39:47 分类: seo優化 閱讀: 次 查看評論

  前面簡要介紹過了搜索引擎的索引系統,實際上在建立倒排索引的最後還需要有一個入庫寫庫的過程,而爲了提高效率這個過程還需要將全部term以及偏移量保存在文件頭部,並且對數據進行壓縮,這涉及到的過于技術化在此就不多提了。今天簡要給大家介紹一下索引之後的檢索系統。

  檢索系統主要包含了五個部分,如下圖所示:

  

  (1)Query串切詞分詞即將用戶的查詢詞進行分詞,對之後的查詢做准備,以“10號線地鐵故障”爲例,可能的分詞如下(同義詞問題暫時略過):

  10 0x123abc

  号 0x13445d

  线 0x234d

  地铁 0x145cf

  故障 0x354df

  (2)查出含每個term的文檔集合,即找出待選集合,如下:

  0x123abc 1 2 3 4 7 9…..

  0x13445d 2 5 8 9 10 11……

  ……

  ……

  (3)求交,上述求交,文檔2和文檔9可能是我們需要找的,整個求交過程實際上關系著整個系統的性能,這裏面包含了使用緩存等等手段進行性能優化;

  (4)各種過濾,舉例可能包含過濾掉死鏈、重複數據、色情、垃圾結果以及你懂的;

  (5)最終排序,將最能滿足用戶需求的結果排序在最前,可能包括的有用信息如:網站的整體評價、網頁質量、內容質量、資源質量、匹配程度、分散度、時效性等等,之後會詳細給大家介紹。

  來源:SEO搜尋引擎優化 - SEO自學網 轉載注明出處!

? 上一篇下一篇 ?   本文關鍵詞: 搜索引擎原理  百度官方資料  

評論列表:

站長SEO學院
第一節:百度搜索引擎工作原理
第二節:建設對搜索引擎友好的站點
第三節:如何進行網站內容建設
第四節:整體優化、結構優化、網頁優化
第五節:移動搜索-明確移動搜索優化標准
百度SEO資料文檔
百度搜索引擎優化指南2.0
百度移動搜索優化指南2.0
網站分析白皮書(站長版)
移動站點該如何優化
建設對百度友好的站點
百度搜索引擎網頁質量白皮書
石榴算法-綠蘿算法-冰桶算法
新搜索時代下的優化策略
更多百度SEO資料文檔
站長推薦
DIV+CSS布局實例教程-Web標准
网站SEO優化常见问题汇总
SEO優化推广方案该如何写
SEO優化方案步骤
影響網站關鍵詞排名因素總結
影響谷歌搜索引擎排名的因素調查
手機移動端站點適配優化
最近發表