itgle.com

17、网络爬虫的类型主要包括:A.通用网络爬虫B.聚焦网络爬虫C.增量式网络爬虫D.深层网络爬虫

题目

17、网络爬虫的类型主要包括:

A.通用网络爬虫

B.聚焦网络爬虫

C.增量式网络爬虫

D.深层网络爬虫


相似考题
更多“17、网络爬虫的类型主要包括:”相关问题
  • 第1题:

    ()爬行过程中最重要部分就是表单填写及处理。

    A、聚焦网络爬虫

    B、增量式网络爬虫

    C、通用网络爬虫

    D、深层网络爬虫


    参考答案:D

  • 第2题:

    ()实现的两个主要目标为保持本地页面集中存储的页面为最新页面和提高本地页面集中页面的质量。

    A、聚焦网络爬虫

    B、增量式网络爬虫

    C、通用网络爬虫

    D、深层网络爬虫


    参考答案:B

  • 第3题:

    如果要采集指定的数据,则需要使用到(),又称主题网络爬虫,是指选择性地爬行那些与预先定义好的主题相关页面的网络爬虫。

    A、增量式网络爬虫

    B、聚焦网络爬虫

    C、DeepWeb爬虫

    D、全网爬虫


    参考答案:B

  • 第4题:

    聚焦网络爬虫和通用网络爬虫相比,增加了链接评价模块以及内容评价模块。()

    此题为判断题(对,错)。


    参考答案:正确

  • 第5题:

    ()只会在需要的时候爬行新产生或发生更新的页面,并不重新下载没有发生变化的页面,可有效减少数据下载量,及时更新已爬行的网页,减小时间和空间上的耗费,但是增加了爬行算法的复杂度和实现难度。

    A、聚焦网络爬虫

    B、增量式网络爬虫

    C、通用网络爬虫

    D、深层网络爬虫


    参考答案:B

  • 第6题:

    如果要采集指定的数据,则需要使用到(),因为它只需要爬行与主题相关的页面,极大地节省了硬件和网络资源,保存的页面也由于数量少而更新快。

    A、聚焦网络爬虫

    B、聚焦网络爬虫

    C、通用网络爬虫

    D、深层网络爬虫


    参考答案:A

  • 第7题:

    ()又称全网爬虫,爬行对象从一些种子URL扩充到整个Web,主要为门户站点搜索引擎和大型Web服务提供商采集数据。

    A、聚焦网络爬虫

    B、增量式网络爬虫

    C、通用网络爬虫

    D、深层网络爬虫


    参考答案:C

  • 第8题:

    用户跟踪技术不包括()。

    • A、IP定位
    • B、Cookie
    • C、网络爬虫
    • D、蠕虫病毒

    正确答案:D

  • 第9题:

    检索引擎组成程序包括()。

    • A、网关程序
    • B、网络爬虫
    • C、网络蜘蛛
    • D、网络机器人
    • E、编译程序

    正确答案:B,C,D

  • 第10题:

    多选题
    python的主要应用包括()。
    A

    网络爬虫

    B

    数据分析

    C

    web开发

    D

    人工智能


    正确答案: A,D
    解析: 暂无解析

  • 第11题:

    单选题
    只爬行新产生的、已经发生变化的网页爬虫,在一定程度上能够保证所爬行的页面为更新页面()。
    A

    通用网络爬虫

    B

    聚焦网络爬虫

    C

    增量式网络爬虫

    D

    反向网络爬虫


    正确答案: B
    解析: 暂无解析

  • 第12题:

    单选题
    爬行对象从一些种子URL扩充到整个网络,主要为了门户站点搜索引擎和大型网络服务提供商采集数据()。
    A

    通用网络爬虫

    B

    聚焦网络爬虫

    C

    增量式网络爬虫

    D

    反向网络爬虫


    正确答案: D
    解析: 暂无解析

  • 第13题:

    ()采集的目标是那些大部分内容不能通过静态链接获取的、隐藏在搜索表单后的,只有用户提交一些关键词才能获得的Web页面。

    A、聚焦网络爬虫

    B、增量式网络爬虫

    C、通用网络爬虫

    D、深层网络爬虫


    参考答案:D

  • 第14题:

    以下关于网络爬虫的说法,不正确的是()。

    A、网络爬虫还可以对网页建立索引

    B、有些网络爬虫能够从网站抓取内容聚合起来

    C、有些网络爬虫甚至能发动DDos攻击、发送垃圾邮件等

    D、隐藏在表单后的信息无法被网络爬虫发现


    参考答案:D

  • 第15题:

    实际的网络爬虫系统通常是几种爬虫技术相结合实现的。()

    此题为判断题(对,错)。


    参考答案:正确

  • 第16题:

    关于各种网络爬虫,以下说法不正确的是()。

    A、通用网络爬虫通常采用并行工作方式,但需要较长时间才能刷新一次页面。

    B、通用网络爬虫适用于为搜索引擎搜索广泛的主题,有较强的应用价值。

    C、聚焦爬虫根据一定的网页分析算法过滤与主题无关的链接,保留有用的链接并将其放入等待抓取的URL队列。

    D、增量式爬虫在需要的时候爬行新产生或发生更新的页面,并重新下载所有页面


    参考答案:D

  • 第17题:

    ()是指对已下载网页采取增量式更新和只爬行新产生的或者已经发生变化网页的爬虫,它能够在一定程度上保证所爬行的页面是尽可能新的页面。

    A、聚焦网络爬虫

    B、增量式网络爬虫

    C、通用网络爬虫

    D、深层网络爬虫


    参考答案:B

  • 第18题:

    (),又称主题网络爬虫,是指选择性地爬行那些与预先定义好的主题相关页面的网络爬虫。

    A、聚焦网络爬虫

    B、增量式网络爬虫

    C、通用网络爬虫

    D、深层网络爬虫


    参考答案:A

  • 第19题:

    网络全文搜索引擎—般包括搜索器、检索器、用户接口和______。

    A.索引器

    B.机器人

    C.爬虫

    D.蜘蛛


    正确答案:A
    解析:现在的全文搜索引擎在外观、功能等方面千差万别,但其一般是由搜索器、索引器、检索器和用户接口4个部分组成。

  • 第20题:

    python的主要应用包括()。

    • A、网络爬虫
    • B、数据分析
    • C、web开发
    • D、人工智能

    正确答案:A,B,C,D

  • 第21题:

    网络全文搜索引擎一般包括搜索器、检索器、用户接口和()

    • A、索引器
    • B、机器人
    • C、爬虫
    • D、蜘蛛

    正确答案:A

  • 第22题:

    单选题
    用户跟踪技术不包括()。
    A

    IP定位

    B

    Cookie

    C

    网络爬虫

    D

    蠕虫病毒


    正确答案: C
    解析: 暂无解析

  • 第23题:

    单选题
    选择性地爬行预先定义好的与主题相关的页面,是()。
    A

    通用网络爬虫

    B

    聚焦网络爬虫

    C

    增量式网络爬虫

    D

    反向网络爬虫


    正确答案: A
    解析: 暂无解析

  • 第24题:

    多选题
    检索引擎组成程序包括()。
    A

    网关程序

    B

    网络爬虫

    C

    网络蜘蛛

    D

    网络机器人

    E

    编译程序


    正确答案: E,C
    解析: 暂无解析