搜索引擎的工作原理(四)

2016年2月21日14:07:21 发表评论

阿里云服务器

查询服务主要工作

查询服务是搜索引擎和用户离得最近的一个模块。在这个模块中主要完成了以下3个工作:

5、 查询匹配

搜索引擎会将用户输入的语句进行分词,并且提取出有意义的查询关键词,然后返回网页中包含有这些关键词的网页。

例如下图,虽然用户查询的是“搜索引擎的原理”,但是搜索引擎会对这个查询进行分词,分成“搜索引擎”、“的”、“原理”三个词,然后删除没有意义的“的”,接着找出和“搜索引擎”、“原理”匹配的网页进行组合生成结果页面。

搜索引擎的工作原理(四)

6、排序结果

预处理中为每个网页形成了一个独立二查询词的重要性指标,将这个指标和查询过程中的相关性指标结合形成最终排序结果,是搜索引擎给出查询排序结果的主要方法。

搜索引擎的工作原理(四)

7、 文档摘要

一般的搜索引擎采用“动态摘要”的方式生成摘要,即在相应查询的时候根据查询词在文档中的位置,提取出周围的文字,在显示时将查询词标亮。

搜索引擎的工作原理(四)

以上就是搜索引擎查询服务的简介,不难看出查询服务还需要一些细节的支持,例如中文自动摘要、搜索结果页的生成等等技术。

maolai

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: