itgle.com
更多“【填空题】Tez是Apache开源的支持DAG作业的计算框架,其思想是对Map与Reduce两个操作进行()。”相关问题
  • 第1题:

    ERP系统支持对混合型生产方式的管理,其管理思想表现在两个方面。其一是()的思想。其二是()的思想。

    A、JIT

    B、看板管理

    C、敏捷制造

    D、计算机集成制造

    E、“精益生产


    参考答案:CE

  • 第2题:

    PHP是一种免费、开源的WEB技术,它通常与Linux、Apache和MySQL等开源软件自由组合,形成简单、安全、低成本和部署灵活的开发平台。()

    此题为判断题(对,错)。


    答案:对

  • 第3题:

    ()是Apache的一个开源子项目,是一种实现数据映射的轻量级框架,减少了应用开发的编码数量。

    A.iBatis

    B.Spring

    C.Hibernate

    D.JDBC


    参考答案:A

  • 第4题:

    关于大数据及应用的描述,不正确的是( )

    A.Fume属于Apache的顶级项目,他是一款高性能,高可用的分布式日志手机系统
    B.MapRaduce模式的主要思想是自动将一个大的计算(如程序)拆解成Map(映射)和Reduce(化简)
    C.Kafka架构分为两层,即生产者(Producer)和消费者(Consumer),他们之间可以直接发送消息
    D.与Hadoop相比,Spark的中间数据存放在内存中,对于迭代运算而言,效率更高

    答案:C
    解析:
    Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统,Flume支持在日志系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理,并写到各种数据接受方(可定制)的能力。
    MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算。概念“Map:(映射)”和“Reduce(归约)”,和它们的主要思想,都是从函数式编程语言里借来的。:它极大地方便了编程人员在不会分布式并行编程的情况下,将自己的程序运行在分布式系统上,从而实现对'HDFS和HBase上的海量数据分析
    Kafka是一种高吞吐量的分布式发布订阅消息系统
    Producer
    负责发布消息到Kafka broker
    Consumer
    消息消费者,向Kafka broker读取消息的客户端。
    Apache Spark是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab(加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架,Spark,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是——Job中间输出结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。
    Spark是一种与Hadoop相似的开源集群计算环境,但是两者之间还存在一些不同之处,这些有用的不同之处使Spark在某些工作负载方面表现得更加优越,换句话说,Spark启用了内存分布数据集,除了能够提供交互式查询外,它还可以优化迭代工作负载。
    Spark是在Scala语言中实现的,它将Scala用作其应用程序框架。与Hadoop不同,Spark和Scala能够紧密集成,其中的Scala可以像操作本地集合对象一样轻松地操作分布式数据集。
    尽管创建Spark是为了支持分布式数据集上的迭代作业,但是实际上它是对Hadoop的补充,可以在Hadoop文件系统中并行运行。通过名为Mesos的第三方集群框架可以支持此行为。Spark由加州大学伯克利分校AMP实验室(Algorithms,Machines,and People Lab)开发,可用来构建大型的、低延迟的数据分析应用程序。

  • 第5题:

    作业管理是指对计算机所进行的操作进行管理,其主要任务是作业调度和作业变换。


    正确答案:错误

  • 第6题:

    在MapReduce编程模式中,Map任务与Reduce任务的数量分别是()?

    • A、一个Map任务,多个Reduce任务
    • B、多个Map任务,多个Reduce任务
    • C、一个Map任务,一个Reduce任务
    • D、多个Map任务,一个Reduce任务

    正确答案:B

  • 第7题:

    大数据处理框架-Spark诞生于()

    • A、伯克利大学AMPLab
    • B、Apache孵化器项目
    • C、Apache顶级项目
    • D、开源项目

    正确答案:A

  • 第8题:

    单选题
    下面关于MapReduce模型中Map函数与Reduce函数的描述正确的是()
    A

    一个Map函数就是对一部分原始数据进行指定的操作

    B

    一个Map操作就是对每个Reduce所产生的一部分中间结果进行合并操作

    C

    Map与Map之间不是相互独立的

    D

    Reduce与Reduce之间不是相互独立的


    正确答案: B
    解析: 暂无解析

  • 第9题:

    单选题
    ()是Apache的一个开源子项目,是一种实现数据映射的轻量级框架,减少了应用开发的编码数量。
    A

    iBatis

    B

    Spring

    C

    Hibernate

    D

    JDBC


    正确答案: A
    解析: 暂无解析

  • 第10题:

    填空题
    对框架的分析,按()理论确定其计算长度

    正确答案: 弹性
    解析: 暂无解析

  • 第11题:

    问答题
    是否所有的MapReduce程序都需要经过Map和Reduce这两个过程?如果不是,请举例说明。

    正确答案: 不是。对于关系的选择运算,只需要Map过程就能实现,对于关系R 中的每个元组t,检测是否是满足条件的所需元组,如果满足条件,则输出键值对<,>,也就是说,键和值都是t。这时的Reduce函数就只是一个恒等式,对输入不做任何变换就直接输出。
    解析: 暂无解析

  • 第12题:

    判断题
    Apache Hadoop 是一个用C语言实现的软件框架,在由大量计算机组成的集群中运行海量数据的分布式计算系统,它可以让应用程序支持上千个节点和PB级别的数据。
    A

    B


    正确答案:
    解析: 暂无解析

  • 第13题:

    关于MapReduce中Shuffle过程,说法错误的是()。

    A.Shuffle过程中为每个Map任务分配一个缓存

    B.Shuffle过程中分区默认采用哈希函数

    C.Shulle过程的合并会改变最终结果

    D.Shuffle过程在Reduce端首先从Map端领取结果,然后执行归并操作,最后输送给Reduce任务进行处理。


    正确答案:C

  • 第14题:

    Struts是一个开源的Web开发框架,它是由哪个组织进行维护的()。

    A、BEA

    B、JBoss

    C、Apache

    D、Sybase


    答案:C

  • 第15题:

    MapReduce框架提供了一种序列化键/值对的方法,支持这种序列化的类能够在Map和Reduce过程中充当键或值,以下说法错误的是()

    A.实现Writable接口的类是值

    B.实现WritableComparable接口的类可以是值或键

    C.Hadoop的基本类型Text并不实现WritableComparable接口

    D.键和值的数据类型可以超出Hadoop自身支持的基本类型


    正确答案:C

  • 第16题:

    Sparkapi对以下语言都支持()

    • A、速度更快
    • B、更适合迭代运算
    • C、编程模型更加灵活,不局限于MAP与REDUCE操作
    • D、中间结果可以存在内存,不需要磁盘的IO读写

    正确答案:A,B,C

  • 第17题:

    hadoop和spark的都是并行计算,两者都是用mr模型来进行并行计算,hadoop的一个作业称为job,job里面分为map?task和reduce?task,每个task都是在自己的进程中运行的,当task结束时,进程也会结束


    正确答案:错误

  • 第18题:

    Google的分布式数据存储管理系统是()?

    • A、GFS
    • B、Chubby
    • C、Big Table
    • D、Map Reduce

    正确答案:C

  • 第19题:

    下面关于MapReduce模型中Map函数与Reduce函数的描述正确的是

    • A、一个Map函数就是对一部分 原始数据进行指定的操作
    • B、一个Map操作就是对每个Reduce所产生的 一部分中间结果进行合并操作
    • C、Map与Map之间不是相互独立的
    • D、Reduce与Reduce之间不是相互独立的

    正确答案:A

  • 第20题:

    单选题
    在MapReduce编程模式中,Map任务与Reduce任务的数量分别是()?
    A

    一个Map任务,多个Reduce任务

    B

    多个Map任务,多个Reduce任务

    C

    一个Map任务,一个Reduce任务

    D

    多个Map任务,一个Reduce任务


    正确答案: D
    解析: 暂无解析

  • 第21题:

    单选题
    Map与Reduce之间的关系是()。
    A

    Map的输出=Reduce的输出

    B

    Map的输入=Reduce的输出

    C

    Map的输出=Reduce的输入

    D

    Map的输入=Reduce的输入


    正确答案: C
    解析: 暂无解析

  • 第22题:

    判断题
    作业管理是指对计算机所进行的操作进行管理,其主要任务是作业调度和作业变换。
    A

    B


    正确答案:
    解析: 暂无解析

  • 第23题:

    单选题
    BigTable对应Apache开源项目中的()
    A

    Hive

    B

    Pig

    C

    Sqoop

    D

    HBase


    正确答案: D
    解析: 暂无解析

  • 第24题:

    填空题
    Android是()开发的基于()平台的开源手机操作系统。

    正确答案: Google,Linux
    解析: 暂无解析