导致hive计算任务产生数据倾斜的原因有哪些?()
A.业务数据本身的特性
B.key分布不均匀
C.建表时考虑不周
D.某些SQL语句本身就有数据倾斜
A.业务数据本身的特性
B.key分布不均匀
C.建表时考虑不周
D.某些SQL语句本身就有数据倾斜
第1题
A.MR框架过多的磁盘操作,缺乏对分布式内存的支持
B.MR框架无法高效地支持迭代式计算
C.MR框架无法高效地支持交互式数据挖掘任务
D.MR框架无法进行分析性计算任务
第3题
A.所有HQL都会转化为MapReduce任务执行
B.DDL语句不提交任务到MapReduce,而是直接操作元数据
C.对于selectcount(*)fromtable操作,一定会启动reduce任务
D.对于selece*fromtable语句不会启MapReduce
第4题
A.Hive支持所有标准SQL语法
B.Hive底层采用的计算引擎是MapReduce
C.Hive提供的HQL语法,与传统SQL很类似
D.HiveServer可采用MySQL存储元数据信息
第6题
A.Hive最终将数据存储在HDFS中
B.Hive是Hadoop平台的数据仓库工具
C.HQL可以通过MapReduce执行任务
D.Hive对HBase有强依赖
第8题
A.工程中途停建、缓建造成的费用损失,比如非施工单位原因导致的人工、设备窝工及有关损失
B.发生工程质量问题造成的工程返修、加固、拆除等工作产生的费用
C.定额直接费未包括,按规定允许计算的相关费用
D.施工单位虚报工程内容造成的工程损失
E.施工单位违规操作造成的停水、停电和安全事故损失
第9题
A.Hive元数据存储独立于数据存储之外,从而解耦合元数据和数据,灵活性高,二传统数据仓库数据应用单一,灵活性低
B.Hive基于HDFS存储,理论上存储可以无限扩容,而传统数据仓库存储量有上限
C.由于Hive的数据存储在HDFS上,所以可以保证数据的高容错,高可靠
D.由于Hive基于大数据平台,所以查询效率比传统数据仓库快
第10题
A、Hive最终将数据存储在HDFS中
B、Hive是Hadoop平台的数据仓库工具
C、HQL可以通过Map Reduce执行任务
D、Hive对HBase有强依赖