下列关于MapReduce说法不正确的是()。
A.MapReduce程序只能用Java写
B.MapReduce是一种计算框架
C.MapReduce来源于google的学术论文
D.MapReduce隐藏了并行计算的细节,方便使用
A.MapReduce程序只能用Java写
B.MapReduce是一种计算框架
C.MapReduce来源于google的学术论文
D.MapReduce隐藏了并行计算的细节,方便使用
第1题
A.MapReduce是处理大量半结构化数据集合的编程模型
B.MapReduce和Hadoop是相互独立的
C.MapReduce使用一种集合语言执行查询
D.MapReduce是Map和Reduce的两部分用户程序组成
第2题
A.YARN以流式数据访问模式来存储超大文件,可以实现一次写入、多次读写
B.Pig支持随机读和几十毫秒级别的查询
C.HBase的主要功能是离线计算
D.MapReduce功能实现了将单个任务打碎,并将碎片任务(Map)发送到多个节点上,之后再将分别计算的结果进行聚合、汇总
第3题
A.MapReduce采用“ 分而治之”策略
B.MapReduce设计的一个理念就是“ 计算向数据靠拢”
C.MapReduce框架采用了Master/Slave架构
D.MapReduce应用程序只能用Java来写
第4题
A.Hive支持所有标准SQL语法
B.Hive底层采用的计算引擎是MapReduce
C.Hive提供的HQL语法,与传统SQL很类似
D.HiveServer可采用MySQL存储元数据信息
第5题
A.mapper调优主要目标之一是减少输出量
B.可以通过对输出进行压缩设置进行mapper调优
C.比较适合map的输出是数值型的,方便进行统计
D.尽量减少combiner,以降低对I/O的读写压力
第7题
A.Shuffle过程中为每个Map任务分配一个缓存
B.Shuffle过程中分区默认采用哈希函数
C.Shulle过程的合并会改变最终结果
D.Shuffle过程在Reduce端首先从Map端领取结果,然后执行归并操作,最后输送给Reduce任务进行处理。
第8题
A.对大数据采取分而治之的思想
B.构建抽象模型:Map和Reduce函数
C.对计算的支持强大,但对文件的支持较弱
D.上升到构架:并行自动化并隐藏低层细节