如果一个Hadoop集群中HDFS的默认大小是128MB,本地磁盘有个HDFS上的目录包含100个纯文本文件,每个文件200MB。如果使用TextInputFormat作为输入格式类,将该目录作为作业输入,将会启动几个Map?()
A.64
B.100
C.200
D.640
A.64
B.100
C.200
D.640
第1题
A.200
B.40000
C.400
D.1200
第5题
A.mkdirhadoo
B.mkdir /hadoo
C.hadoopmkdirhadoo
D.hadoop fs –mkdir /hadoo
第6题
A.写入数据的时候会写到不同机架的DataNode中
B.如果一个机架出问题,不会影响数据读写
C.MapReduce会根据机架获取离自己比较近的网络数据
D.机架感知是Hadoop默认配置,无需再做配置设置
第7题
A.HDFS并不是一个单机文件系统,它是分布在多个集群节点上的文件系统
B.仅仅对数据进行冗余备份还不够,HDFS要有一个更有效的副本存放策略
C.对于HDFS来说,丢失一个Data Node意味着丢失了存储在它的硬盘上的数据块的副本
D.如果要存放数据的节点宕机,HDFS会再分配三个节点给数据块
第8题
A.HDFS:分布式文件系统,是Hadoop项目的两大核心之一,是谷歌GFS的开源实现
B.HBase:提供高可靠性、高性能、分布式的行式数据库,是谷歌Big Table的开源实现
C.Hive:一个基于Hadoop的数据仓库工具,用于对Hadoop文件中的数据集进行数据整理、特殊查询和分析存储
D.Zookeeper:针对谷歌Chubby的一个开源实现,是高效可靠的协同工作系统
第10题
A.300300
B.3000300
C.600600
D.3000600