关于MapReduce说法错误的是（）A．数据处理过程分为Map和Reduce两个阶段B．Map阶段是由一系列Map任务组成的C．Reduce阶段是由一系列Reduce任务组成的D．Map任务繁忙时，可以借助执行Reduce任务的机器来执行Map任务

题目

关于MapReduce说法错误的是（）

A．数据处理过程分为Map和Reduce两个阶段

B．Map阶段是由一系列Map任务组成的

C．Reduce阶段是由一系列Reduce任务组成的

D．Map任务繁忙时，可以借助执行Reduce任务的机器来执行Map任务

相似考题

1.关于平等权说法错误的是( )。

2.支持向量机的MapReduce实现要进行几轮MapReduce()。A.自行规定B.3C.2D.1

3.KNN算法用MapReduce实现,要进行几轮MapReduce()。A.4B.3C.2D.1

4.关于Block和Split两个概念,下面说法错误的是()。A、Block是HDFS中最小的数据存储单位B、Split是MapReduce中最小的计算单元C、Block与Split是一一对应关系D、Block和Split之间对应关系是任意的，可由用户控制

更多“关于MapReduce说法错误的是（）”相关问题

第1题：

MapReduce与传统并行计算框架的对比中,说法正确的是()。

A.MapReduce属于共享式集群架构，容错性好
B.传统并行计算框架比MapReduce硬件更加便宜
C.传统并行计算框架适用于实时、细粒度计算
D.MapReduce适用于数据密集型，传统并行计算框架适用于计算密集型

标准答案：CD
第2题：

关于委托作品下列说法错误的是（）。

正确答案：C
本题考查委托作品的相关问题。委托作品，是指作者接受他人委托而创作的作品。委托作品的创作基础是委托合同，既可以是口头的，也可以是书面的；既可以是有偿的，也可以是无偿的。委托作品应体现委托人的意志，实现委托人使用作品的目的。委托钟品的著作权归属由委托人和受托人通过合同约定。
第3题：

有关MapReduce的输入输出,说法错误的是()

A.链接多个MapReduce作业时，序列文件是首选格式
B.FileInputFormat中实现的getSplits()可以把输入数据划分为分片，分片数目和大小任意定义
C.想完全禁止输出，可以使用NullOutputFormat
D.每个reduce需将它的输出写入自己的文件中，输出无需分片

正确答案：B
解析：分片数目在numSplits中限定，分片大小必须大于mapred.min.size个字节，但小于文件系统的块
第4题：

MapReduce的Map函数产生很多的（）
- A、key
- B、value
- C、
- D、Hash
正确答案:C
第5题：

mapreduce是基于（）运行的计算框架
- A、内存
- B、磁盘
- C、内存加磁盘
- D、网络
正确答案:B
第6题：

关于域名的说法，（）是错误的。

正确答案:域名区分英文字母大小写
第7题：

问答题
Spark的出现是为了解决Hadoop MapReduce的不足，试列举Hadoop MapReduce的几个缺陷，并说明Spark具备哪些优点。

正确答案：（1）Hadoop存在以下缺点：
①表达能力有限；②磁盘IO开销大；③延迟高
（2）Spark主要有如下优点：
①Spark的计算模式也属于MapReduce，但不局限于Map和Reduce操作，还提供了多种数据集操作类型，编程模型比MapReduce更灵活；
②Spark提供了内存计算，中间结果直接存放内存中，带来更高的迭代运算效率；
③Spark基于DAG的任务调度执行机制，要优于MapReduce的迭代执行机制。
解析：暂无解析
第8题：

单选题
关于Hive和Hadoop其他组件的关系，以下描述错误的是？（）
A
Hive最终将数据存储在HDFS中
B
HiveSQL其本质是执行MapReduce任务
C
Hive是Hadoop平台的数据仓库工具
D
Hive对HBase有强依赖

正确答案： D
解析：暂无解析
第9题：

判断题
MapReduce设计的一个理念是“数据向计算靠拢”
A
对
B
错

正确答案：错
解析：暂无解析
第10题：

单选题
有关MapReduce的输入输出，说法错误的是（）.
A
链接多个MapReduce作业时，序列文件是首选格式
B
把输入数据划分为分片，分片数目和大小任意定义
C
想完全禁止输出，可以使用Null Output Format
D
每个reduce需将它的输出写入自己的文件中，输出无需分片

正确答案： C
解析：暂无解析
第11题：

多选题
关于Spark和Mapreduce，下列说法正确的是（）。
A
性能上提升高于100倍（全内存计算）
B
Spark的中间数据放在内存中，对于迭代运算、批处理计算的效率更高，延迟更低。
C
提供更多的数据集操作类型，编程模型更灵活，开发效率更高。
D
更低的容错能力（血统机制）。
E
Spark用十分之一的资源，获得10倍与Mapreduce的性能。

正确答案： E,B
解析：暂无解析
第12题：

问答题
MapReduce 是处理大数据的有力工具，但不是每个任务都可以使用MapReduce 来进行处理。试述适合用MapReduce来处理的任务或者数据集需满足怎样的要求。

正确答案：适合用MapReduce来处理的数据集，需要满足一个前提条件：待处理的数据集可以分解成许多小的数据集，而且每一个小数据集都可以完全并行地进行处理。
解析：暂无解析
第13题：

关于MapReduce中Shuffle过程,说法错误的是()。

A.Shuffle过程中为每个Map任务分配一个缓存
B.Shuffle过程中分区默认采用哈希函数
C.Shulle过程的合并会改变最终结果
D.Shuffle过程在Reduce端首先从Map端领取结果，然后执行归并操作，最后输送给Reduce任务进行处理。

正确答案:C
第14题：

下列关于MapReduce说法不正确的是( )。

A.MapReduce是一种计算框架
B.MapReduce来源于google的学术论文
C.MapReduce程序只能用java语言编写
D.MapReduce隐藏了并行计算的细节，方便使用

正确答案：C
第15题：

在高阶数据处理中,往往无法把整个流程写在单个MapReduce作业中,下列关于链接MapReduce作业的说法,不正确的是()

A.Job和JobControl类可以管理非线性作业之间的依赖
B.ChainMapper和ChainReducer类可以用来简化数据预处理和后处理的构成
C.使用ChainReducer时，每个mapper和reducer对象都有一个本地JobConf对象
D.ChainReducer.addMapper()方法中，一般对键/值对发送设置成值传递，性能好且安全性高

正确答案：D
第16题：

以下哪个组件和Tachyon是类似的组件（）
- A、hdfs
- B、yarn
- C、spark
- D、mapreduce
正确答案:A
第17题：

有关MapReduce的输入输出，说法错误的是（）.
- A、链接多个MapReduce作业时，序列文件是首选格式
- B、把输入数据划分为分片，分片数目和大小任意定义
- C、想完全禁止输出，可以使用Null Output Format
- D、每个reduce需将它的输出写入自己的文件中，输出无需分片
正确答案:B
第18题：

若不针对MapReduce编程模型中的key和value值进行特别设置，下列哪一项是MapReduce不适宜的运算（）。
- A、Max
- B、Min
- C、Count
- D、Average
正确答案:D
第19题：

单选题
关于MapReduce的描述，错误的是（）。
A
易于编程
B
良好的扩展性
C
实时计算
D
高容错性

正确答案： D
解析：暂无解析
第20题：

多选题
关于MapReduce容错机制，下面说法正确的是（）
A
JobTracker可以有多个，因此不存在单点故障问题
B
TaskTracker通过周期性心跳向JobTracker表明自己还活着
C
MapTask失败后，能够被重新调度到其他节点上执行
D
ReduceTask失败后，能够被重新调度到其他节点上执行

正确答案： A,D
解析：暂无解析
第21题：

单选题
MapReduce是（）公司开发的编程模型。
A
IBM
B
Google
C
Apache
D
Oracle

正确答案： D
解析：暂无解析
第22题：

问答题
MapReduce适合做哪些计算？

正确答案： MapReduce计算模型对于高性能要求的应用以及平行计算领域的需求非常适合。对于大量数据要做同样的计算的时候，就可以把数据进行划分，然后分配到不同的机器上来分别作计算。
解析：暂无解析
第23题：

问答题
试述MapReduce和Hadoop的关系。

正确答案：谷歌公司最先提出了分布式并行编程模型MapReduce， Hadoop MapReduce是它的开源实现。谷歌的MapReduce运行在分布式文件系统GFS上，与谷歌类似，HadoopMapReduce运行在分布式文件系统HDFS上。相对而言，HadoopMapReduce 要比谷歌MapReduce 的使用门槛低很多，程序员即使没有任何分布式程序开发经验，也可以很轻松地开发出分布式程序并部署到计算机集群中。
解析：暂无解析
第24题：

多选题
MapReduce基于Google发布的MapReduce论文设计开发，其具有如下哪些特点？（）
A
易于编程
B
高速度
C
良好的扩展性
D
高容错性

正确答案： A,C,D
解析：暂无解析

itgle.com

关于MapReduce说法错误的是（）A．数据处理过程分为Map和Reduce两个阶段B．Map阶段是由一系列Map任务组成的C．Reduce阶段是由一系列Reduce任务组成的D．Map任务繁忙时，可以借助执行Reduce任务的机器来执行Map任务

题目

相似考题

更多“关于MapReduce说法错误的是（）”相关问题

相关内容