高中信息技术《网海寻珠-搜索引擎的工作原理》
一、考题回顾
题目来源:2019年5月19日北京市面试考题
试讲题目
1.题目:搜索引擎的工作原理
2.内容:
搜索引擎的工作原理
搜索引擎不能真正实时地在因特网上捜索信息,而是搜索预先整理好的网页索引数据库。它不能真正理解网页上的内容, 只能机械的匹配网页上的文字。
真正意文上的搜索引擎,通常指收集了因特网上几千万乃至几十亿个网页并对网页中的每一个词(搜索的关键词)进行索引。建立索引数据库的全文搜索引擎。当用户输入某个关键词进行检索时,所有页面内容中包含了该关键词的网页都被作为搜索结果进行处理。在经过一些算法进行排序后,搜索到的结果最终按照与搜索关键词相关程度的高低依次排列出来。
搜索引擎的整个工作过程可以简单的理解为三步:一是从互联网上抓取网页,二是建立索引数据库,三是在索引数据库中对搜索结果进行排序,如图3-2-4所示。
1.从因特网上抓取网页
搜索引擎利用能够从因特网上自动收集网页的“蜘蛛”(Spider)系统程序,自动访问因特网,沿着网页中的所有链接“爬”到其他网页,重复这一过程,并把所有“爬”过的网页收集过来。
2.建立索引数据库
分析索引程序对收集回来的网页进行分析,提取相关网页信息,包括网页的URL,编码类型,页面内容包含的所有关键词,关键词的位置、生成时间、大小、与其他网页的链接关系等,根据一定的相关度算法进行大量复杂计算,得到每一个网页针对页面文字及链接中每一个关键词的相关程度(或重要性),然后用这些相关信息建立网页索引数据库。
3.在索引数据库中对搜索结果进行排序
当用户输人关键词搜索后,搜索系统程序就从网页索引数据库中查找与该关键词相匹配的所有网页。然后根据这些网页与关键词的相关程度,对搜索到的数值进行排序。一般来讲,相关程度越高,排的次序越靠前。
3.基本要求:
(1)请在10分钟内完成试讲。
(2)配合讲解过程中要有学生参与。
(3)试讲过程中涉及操作,进行演示即可。
答辩题目1.本节课你是通过什么方式进行小结?
2.请你说出搜索引擎的工作过程?