蜘蛛抓取回来的页面,再经过搜索引擎的预处理后,页面就会保存在索引数据库中了,用户在搜索框中输入查询的关键词后,排名程序就会调用索引数据库中的数据,计算排名显示给用户。一般情况下,检索服务可以分为两个步骤:
(1)处理查询词
搜索引擎首先会将用户查询的关键词通过分词的方法进行拆分,例如搜索词为“哪里有靠谱的seo入门教程”可拆分为“seo入门教程”、“靠谱的seo教程”等等。
(2)获取排序
查询的问题被拆分之后,搜索引擎会将拆分结果与预处理时建立的索引数据进行对比,之后利用倒排索引将对比后最匹配的结果展示给用户。
在检索过程中,搜索引擎是根据用户搜索的词来展现给用户对应页面的。从这里我们可以看出,优化网站的时候,关键词的选择特别重要,我们一定要挖掘出所在行业的用户习惯搜索的词是哪些,然后将这些词在网站中进行合理布局优化。
综上,蜘蛛在互联网中抓取网页后,将网页存放在原始数据库中。网页在原始数据库中经过预处理(提取文字、中文分词、页面去重、PR计算、建立索引、链接分析),才能参与用户的搜索展现,流程大致如下:
请添加微信后购买资源
马兔子微信