itgle.com

关于MapReduce说法错误的是()A.数据处理过程分为Map和Reduce两个阶段B.Map阶段是由一系列Map任务组成的C.Reduce阶段是由一系列Reduce任务组成的D.Map任务繁忙时,可以借助执行Reduce任务的机器来执行Map任务

题目

关于MapReduce说法错误的是()

A.数据处理过程分为Map和Reduce两个阶段

B.Map阶段是由一系列Map任务组成的

C.Reduce阶段是由一系列Reduce任务组成的

D.Map任务繁忙时,可以借助执行Reduce任务的机器来执行Map任务


相似考题
更多“关于MapReduce说法错误的是()”相关问题
  • 第1题:

    MapReduce与传统并行计算框架的对比中,说法正确的是()。

    A.MapReduce属于共享式集群架构,容错性好

    B.传统并行计算框架比MapReduce硬件更加便宜

    C.传统并行计算框架适用于实时、细粒度计算

    D.MapReduce适用于数据密集型,传统并行计算框架适用于计算密集型


    标准答案:CD

  • 第2题:

    关于委托作品下列说法错误的是( )。


    正确答案:C
    本题考查委托作品的相关问题。委托作品,是指作者接受他人委托而创作的作品。委托作品的创作基础是委托合同,既可以是口头的,也可以是书面的;既可以是有偿的,也可以是无偿的。委托作品应体现委托人的意志,实现委托人使用作品的目的。委托钟品的著作权归属由委托人和受托人通过合同约定。

  • 第3题:

    有关MapReduce的输入输出,说法错误的是()

    A.链接多个MapReduce作业时,序列文件是首选格式

    B.FileInputFormat中实现的getSplits()可以把输入数据划分为分片,分片数目和大小任意定义

    C.想完全禁止输出,可以使用NullOutputFormat

    D.每个reduce需将它的输出写入自己的文件中,输出无需分片


    正确答案:B
    解析:分片数目在numSplits中限定,分片大小必须大于mapred.min.size个字节,但小于文件系统的块

  • 第4题:

    MapReduce的Map函数产生很多的()

    • A、key
    • B、value
    • C、
    • D、Hash

    正确答案:C

  • 第5题:

    mapreduce是基于()运行的计算框架

    • A、内存
    • B、磁盘
    • C、内存加磁盘
    • D、网络

    正确答案:B

  • 第6题:

    关于域名的说法,()是错误的。


    正确答案:域名区分英文字母大小写

  • 第7题:

    问答题
    Spark的出现是为了解决Hadoop MapReduce的不足,试列举Hadoop MapReduce的几个缺陷,并说明Spark具备哪些优点。

    正确答案: (1)Hadoop存在以下缺点:
    ①表达能力有限;②磁盘IO开销大;③延迟高
    (2)Spark主要有如下优点:
    ①Spark的计算模式也属于MapReduce,但不局限于Map和Reduce操作,还提供了多种数据集操作类型,编程模型比MapReduce更灵活;
    ②Spark提供了内存计算,中间结果直接存放内存中,带来更高的迭代运算效率;
    ③Spark基于DAG的任务调度执行机制,要优于MapReduce的迭代执行机制。
    解析: 暂无解析

  • 第8题:

    单选题
    关于Hive和Hadoop其他组件的关系,以下描述错误的是?()
    A

    Hive最终将数据存储在HDFS中

    B

    HiveSQL其本质是执行MapReduce任务

    C

    Hive是Hadoop平台的数据仓库工具

    D

    Hive对HBase有强依赖


    正确答案: D
    解析: 暂无解析

  • 第9题:

    判断题
    MapReduce设计的一个理念是“数据向计算靠拢”
    A

    B


    正确答案:
    解析: 暂无解析

  • 第10题:

    单选题
    有关MapReduce的输入输出,说法错误的是().
    A

    链接多个MapReduce作业时,序列文件是首选格式

    B

    把输入数据划分为分片,分片数目和大小任意定义

    C

    想完全禁止输出,可以使用Null Output Format

    D

    每个reduce需将它的输出写入自己的文件中,输出无需分片


    正确答案: C
    解析: 暂无解析

  • 第11题:

    多选题
    关于Spark和Mapreduce,下列说法正确的是()。
    A

    性能上提升高于100倍(全内存计算)

    B

    Spark的中间数据放在内存中,对于迭代运算、批处理计算的效率更高,延迟更低。

    C

    提供更多的数据集操作类型,编程模型更灵活,开发效率更高。

    D

    更低的容错能力(血统机制)。

    E

    Spark用十分之一的资源,获得10倍与Mapreduce的性能。


    正确答案: E,B
    解析: 暂无解析

  • 第12题:

    问答题
    MapReduce 是处理大数据的有力工具,但不是每个任务都可以使用MapReduce 来进行处理。试述适合用MapReduce来处理的任务或者数据集需满足怎样的要求。

    正确答案: 适合用MapReduce来处理的数据集,需要满足一个前提条件:待处理的数据集可以分解成许多小的数据集,而且每一个小数据集都可以完全并行地进行处理。
    解析: 暂无解析

  • 第13题:

    关于MapReduce中Shuffle过程,说法错误的是()。

    A.Shuffle过程中为每个Map任务分配一个缓存

    B.Shuffle过程中分区默认采用哈希函数

    C.Shulle过程的合并会改变最终结果

    D.Shuffle过程在Reduce端首先从Map端领取结果,然后执行归并操作,最后输送给Reduce任务进行处理。


    正确答案:C

  • 第14题:

    下列关于MapReduce说法不正确的是( )。

    A.MapReduce是一种计算框架

    B.MapReduce来源于google的学术论文

    C.MapReduce程序只能用java语言编写

    D.MapReduce隐藏了并行计算的细节,方便使用


    正确答案:C

  • 第15题:

    在高阶数据处理中,往往无法把整个流程写在单个MapReduce作业中,下列关于链接MapReduce作业的说法,不正确的是()

    A.Job和JobControl类可以管理非线性作业之间的依赖

    B.ChainMapper和ChainReducer类可以用来简化数据预处理和后处理的构成

    C.使用ChainReducer时,每个mapper和reducer对象都有一个本地JobConf对象

    D.ChainReducer.addMapper()方法中,一般对键/值对发送设置成值传递,性能好且安全性高


    正确答案:D

  • 第16题:

    以下哪个组件和Tachyon是类似的组件()

    • A、hdfs
    • B、yarn
    • C、spark
    • D、mapreduce

    正确答案:A

  • 第17题:

    有关MapReduce的输入输出,说法错误的是().

    • A、链接多个MapReduce作业时,序列文件是首选格式
    • B、把输入数据划分为分片,分片数目和大小任意定义
    • C、想完全禁止输出,可以使用Null Output Format
    • D、每个reduce需将它的输出写入自己的文件中,输出无需分片

    正确答案:B

  • 第18题:

    若不针对MapReduce编程模型中的key和value值进行特别设置,下列哪一项是MapReduce不适宜的运算()。

    • A、Max
    • B、Min
    • C、Count
    • D、Average

    正确答案:D

  • 第19题:

    单选题
    关于MapReduce的描述,错误的是()。
    A

    易于编程

    B

    良好的扩展性

    C

    实时计算

    D

    高容错性


    正确答案: D
    解析: 暂无解析

  • 第20题:

    多选题
    关于MapReduce容错机制,下面说法正确的是()
    A

    JobTracker可以有多个,因此不存在单点故障问题

    B

    TaskTracker通过周期性心跳向JobTracker表明自己还活着

    C

    MapTask失败后,能够被重新调度到其他节点上执行

    D

    ReduceTask失败后,能够被重新调度到其他节点上执行


    正确答案: A,D
    解析: 暂无解析

  • 第21题:

    单选题
    MapReduce是()公司开发的编程模型。
    A

    IBM

    B

    Google

    C

    Apache

    D

    Oracle


    正确答案: D
    解析: 暂无解析

  • 第22题:

    问答题
    MapReduce适合做哪些计算?

    正确答案: MapReduce计算模型对于高性能要求的应用以及平行计算领域的需求非常适合。对于大量数据要做同样的计算的时候,就可以把数据进行划分,然后分配到不同的机器上来分别作计算。
    解析: 暂无解析

  • 第23题:

    问答题
    试述MapReduce和Hadoop的关系。

    正确答案: 谷歌公司最先提出了分布式并行编程模型MapReduce, Hadoop MapReduce是它的开源实现。谷歌的MapReduce运行在分布式文件系统GFS上,与谷歌类似,HadoopMapReduce运行在分布式文件系统HDFS上。相对而言,HadoopMapReduce 要比谷歌MapReduce 的使用门槛低很多,程序员即使没有任何分布式程序开发经验,也可以很轻松地开发出分布式程序并部署到计算机集群中。
    解析: 暂无解析

  • 第24题:

    多选题
    MapReduce基于Google发布的MapReduce论文设计开发,其具有如下哪些特点?()
    A

    易于编程

    B

    高速度

    C

    良好的扩展性

    D

    高容错性


    正确答案: A,C,D
    解析: 暂无解析