HDFS能提供高吞吐量的数据访问,非常适合于大规模数据集上的应用。()
HDFS能提供高吞吐量的数据访问,非常适合于大规模数据集上的应用。()
HDFS能提供高吞吐量的数据访问,非常适合于大规模数据集上的应用。()
第5题
A.标准存储
B.低频访问
C.归档存储
D.标准和归档存储
第6题
B.大规模并行计算:在分布式并行环境中将一个任务分解成更多份细粒度的子任务,这些子任务在空闲的处理节点之间被调度和快速处理之后,最终通过特定的规则进行合并生成最终的结果。典型技术为MapReduce
C.结构化分布式数据存储:类似文件系统采用数据库来存储结构化数据,云计算也需要采用特殊技术实现结构化数据存储,典型技术为BigTable/Dynamo等
D.分布式文件系统:可扩展的支持海量数据的分布式文件系统,用于大型的、分布式的、对大量数据进行访问的应用。它运行于廉价的普通硬件上,提供容错功能(通常保留数据的3份拷贝),典型技术为GFS/HDFS/KFS等
第7题
A.HDFS 本身是个高可用系统架构
B.HDFS 采取的是多 Name Node、 Data Node架构,数量可以任意选择
C.HDFS 数据副本的数量越大越好
D.HDFS Name Node分主备, 主备不同时对外服务
第8题
A.计算资源标签调度是yarm的特征,存储资源调度是HDFS的特征
B.通过存储资源标签,可以将在线应用数据存储在SAS盘节点的HDFS目录下,而离线应用数据存储在SATA盘节点对应的HDFS目录下
C.通过计算资源标签,可以将spark作业调度到大内存节点上运行,而MR作业调度在标配内存节点上运行
D.计算资源和存储资源的标签通常配合使用,是为了将指定的应用跨节点访问计算和数据资源
第10题
A.Hive元数据存储独立于数据存储之外,从而解耦合元数据和数据,灵活性高,二传统数据仓库数据应用单一,灵活性低
B.Hive基于HDFS存储,理论上存储可以无限扩容,而传统数据仓库存储量有上限
C.由于Hive的数据存储在HDFS上,所以可以保证数据的高容错,高可靠
D.由于Hive基于大数据平台,所以查询效率比传统数据仓库快