下列关于Map/Reduce并行计算模型叙述正确的一项为（）

A.Map/Reduce把待处理的数据集分割成许多大的数据块

B.大数据块经Map()函数并行处理后输出新的中间结果

C.reduce()函数把多任务处理后的中间结果进行汇总

D.reduce阶段的作用接受来自输出列表的迭代器

答案

查看答案

发布时间：2022-07-27

更多“下列关于Map/Reduce并行计算模型叙述正确的一项为（）”相关的问题

第1题

Map Reduce则为海量的数据提供了并行计算从而大大提高了计算效率。（）

点击查看答案

第2题

下列关于MapReduce处理大数据的基本思想的三个层面,错误的是（)。

A.对大数据采取分而治之的思想

B.构建抽象模型:Map和Reduce函数

C.对计算的支持强大,但对文件的支持较弱

D.上升到构架:并行自动化并隐藏低层细节

点击查看答案

第3题

关于MapReduce描述不正确的是（)。

A.MapReduce是处理大量半结构化数据集合的编程模型

B.MapReduce和Hadoop是相互独立的

C.MapReduce使用一种集合语言执行查询

D.MapReduce是Map和Reduce的两部分用户程序组成

点击查看答案

第4题

传统的MapReduce模型要求每一轮MapReduce操作之后，数据必须落地到分布式文件系统上。而一般的MapReduce应用通常由多个MapReduce作业组成，每个作业结束之后需要写入磁盘，接下去的Map任务很多情况下只是读一遍数据，为后续的Shuffle阶段做准备，这样其实造成了冗余的IO操作。为了解决这一问题，提供更优的性能，大数据计算服务提供了扩展的MapReduce模型，该模型区别于普通MapReduce模型的主要特点是：()。

A.支持Map后连接任意多个Reduce操作，如Map-Reduce-Reduce

B.支持Map后不连接Reduce，而是连接另一个map，如Map-Map-Reduce

C.支持ChainMapper/Reducer，即支持Map-Reduce-Map-Reduce

D.支持没有Map，直接进入Reduce

点击查看答案

第5题

关于HIVE的描述不正确的是:()。

关于HIVE的描述不正确的是:（)。

A、Hive最佳使用场景是大数据集的批处理作业

B、Hive可以实现在大规模集群上实现低延迟快速查询

C、Hive构建在基于静态批量处理的Hadoop之上，Hadoop通常有较高的延迟并且在提交作业和调度的时候需要大量的开销

D、Hive查询操作过程严格遵循HadoopMap Reduce的作用执行模型，Hive将用户的HiveSQL语句通过解释器转换为Map ReduceHadoop集群上