itgle.com

搜索引擎抓到网页后,还要做大量的预处理工作,才能提供检索服务。其中,最重要的是提取关键词,建立()文件,其他还包括去除重复网页、分析超链接,计算网页的重要度。A.系统B.动态C.索引D.下载

题目
搜索引擎抓到网页后,还要做大量的预处理工作,才能提供检索服务。其中,最重要的是提取关键词,建立()文件,其他还包括去除重复网页、分析超链接,计算网页的重要度。

A.系统

B.动态

C.索引

D.下载


相似考题

3.高中信息技术《网海寻珠-搜索引擎的工作原理》 一、考题回顾 题目来源:2019年5月19日北京市面试考题 试讲题目 1.题目:搜索引擎的工作原理 2.内容: 搜索引擎的工作原理 搜索引擎不能真正实时地在因特网上捜索信息,而是搜索预先整理好的网页索引数据库。它不能真正理解网页上的内容, 只能机械的匹配网页上的文字。 真正意文上的搜索引擎,通常指收集了因特网上几千万乃至几十亿个网页并对网页中的每一个词(搜索的关键词)进行索引。建立索引数据库的全文搜索引擎。当用户输入某个关键词进行检索时,所有页面内容中包含了该关键词的网页都被作为搜索结果进行处理。在经过一些算法进行排序后,搜索到的结果最终按照与搜索关键词相关程度的高低依次排列出来。 搜索引擎的整个工作过程可以简单的理解为三步:一是从互联网上抓取网页,二是建立索引数据库,三是在索引数据库中对搜索结果进行排序,如图3-2-4所示。1.从因特网上抓取网页 搜索引擎利用能够从因特网上自动收集网页的“蜘蛛”(Spider)系统程序,自动访问因特网,沿着网页中的所有链接“爬”到其他网页,重复这一过程,并把所有“爬”过的网页收集过来。 2.建立索引数据库 分析索引程序对收集回来的网页进行分析,提取相关网页信息,包括网页的URL,编码类型,页面内容包含的所有关键词,关键词的位置、生成时间、大小、与其他网页的链接关系等,根据一定的相关度算法进行大量复杂计算,得到每一个网页针对页面文字及链接中每一个关键词的相关程度(或重要性),然后用这些相关信息建立网页索引数据库。 3.在索引数据库中对搜索结果进行排序 当用户输人关键词搜索后,搜索系统程序就从网页索引数据库中查找与该关键词相匹配的所有网页。然后根据这些网页与关键词的相关程度,对搜索到的数值进行排序。一般来讲,相关程度越高,排的次序越靠前。 3.基本要求: (1)请在10分钟内完成试讲。 (2)配合讲解过程中要有学生参与。 (3)试讲过程中涉及操作,进行演示即可。 答辩题目1.本节课你是通过什么方式进行小结? 2.请你说出搜索引擎的工作过程?

更多“搜索引擎抓到网页后,还要做大量的预处理工作,才能提供检索服务。其中,最重要的是提取关键词,建立()文件,其他还包括去除重复网页、分析超链接,计算网页的重要度。 ”相关问题
  • 第1题:

    7、进行搜索引擎关键词分析基本方法包括:

    A.建立关键词词库索引列表

    B.关键词分类统计

    C.关键词排名的深度分析

    D.对重要网页分别跟踪统计


    关键词分类统计;关键词排名的深度分析;对重要网页分别跟踪统计

  • 第2题:

    在国外搜索引擎界曾经有这样一句话:“如果你的网页不能被Google检索到,那么你的网页等于不存在;如果你的网页不能被Google检索排在检索结果第一页中,那么你的网页也等于不存在”。 这句话有很多理解,其中哪些项理解正确?

    A.Google搜索引擎很重要

    B.搜索引擎排名很重要

    C.关键词匹配很重要

    D.被搜索引擎能检索到很重要


    必须是教材中某一章节的标题。?所选句子要尽可能长一点,最好超过20个字。?必须是教材上的一句话,而且这句话有可能出现在ppt上。?必须有一定的区分度,尽可能不出现在其他教材的ppt上。

  • 第3题:

    97、关于网页快照的说法不正确的是 。

    A.“网页快照”是搜索引擎在收录网页时,备份保存在搜索引擎的服务器缓存里的内容

    B.当检索到的网页被删除或链接失效时,即使使用网页快照也不能打开链接

    C.网页快照中,关键字会用其他颜色显示(如红色或者黄色),因此通过网页快照可以快速定位关键词

    D.由于网页快照以文本内容为主,因此网页快照的访问速度比一般的网页快


    当检索到的网页被删除或链接失效时,即使使用网页快照也不能打开链接

  • 第4题:

    搜索引擎关键词分析基本方法是对重要网页分别跟踪统计


    关键词分类统计;关键词排名的深度分析;对重要网页分别跟踪统计

  • 第5题:

    4、搜索引擎关键词分析基本方法是对重要网页分别跟踪统计


    关键词分类统计;关键词排名的深度分析;对重要网页分别跟踪统计