单元测试(二)"/>
【大数据分布并行处理】单元测试(二)
文章目录
- 第二单元
- 单选题
- 多选题
- 填空题
第二单元
单选题
-
每种大数据产品都有特定的应用场景,以下哪个产品是用于图计算的:
A. MapReduce
B. GraphX
C. Hive
D. Streams
正确答案: B -
每种大数据产品都有特定的应用场景,以下哪个产品是用于查询分析计算的:
A. MapReduce
B. Storm
C. GraphX
D. Dremel
正确答案: D -
以下对Hadoop的说法错误的是:
A. Hadoop2.0增加了NameNode HA和Wire-compatibility两个重大特性
B. Hadoop的核心是HDFS和MapReduce
C. Hadoop MapReduce是针对谷歌MapReduce的开源实现,通常用于大规模数据集的并行计算
D. Hadoop是基于Java语言开发的,只支持Java语言编程
正确答案: D -
以下哪个不是Hadoop的特性:
A. 高可靠性
B. 支持多种编程语言
C. 高容错性
D. 成本高
正确答案: D -
以下名词解释不正确的是:
A. HDFS:分布式文件系统,是Hadoop项目的两大核心之一,是谷歌GFS的开源实现
B. HBase:提供高可靠性、高性能、分布式的行式数据库,是谷歌BigTable的开源实现
C. Zookeeper:针对谷歌Chubby的一个开源实现,是高效可靠的协同工作系统
D. Hive:一个基于Hadoop的数据仓库工具,用于对Hadoop文件中的数据集进行数据整理、特殊查询和分析存储
正确答案: B -
Hadoop的创建者是下面哪一位:
A. Mike Cafarella
B. Tom White
C. Kent Beck
D. Doug Cutting
正确答案: D -
下面关于Hadoop叙述不正确的是:
A. Hadoop是Apache开源软件基金会所开发的分布式系统基础架构
B. Hadoop必须运行于大规模的高性能服务器上
C. Hadoop是基于Java语言开发的,具有很好的跨平台特性
D. Hadoop是大数据存储、计算、分析的分布式存储系统和分布式运算框架
正确答案: B -
关于Hadoop的发展史叙述不正确的是:
A. Hadoop是Apache Lucene的子项目之一
B. 2008年1月,Hadoop成为Apache顶级项目
C. 2006年3月,Yahoo!建设了第一个Hadoop集群用于开发
D. Google发表的Bigtable论文,激起了HDFS的创建
正确答案: D -
与HDFS类似的框架是:
A. FAT32
B. NTFS
C. FAT32
D. GFS
正确答案: D -
不属于Hadoop生态系统的是:
A. HDFS
B. HBase
C. GFS
D. Hive
正确答案: C
多选题
-
每种大数据产品都有特定的应用场景,以下哪个产品是用于批处理的:
A. Storm
B. Graphx
C. MapReduce
D. Spark
正确答案: CD -
每种大数据产品都有特定的应用场景,以下哪个产品可用于流计算:
A. Spark
B. Cassandra
C. pregel
D. Flume
正确答案: AD -
下列属于NoSQL数据库的是:
A. neo4j
B. Redis
C. SQL Server
D. MongoDB
正确答案: ABD -
以下关于Hadoop的说法正确的是
A. 可以运行在大量廉价商用机器上
B. 提供容错机制
C. 硬件错误较少发生
D. 成本低
正确答案: ABD -
关于hadoop配置文件描述正确的是?
A. NameNode的主机名和端口号需要在core-site.xml 文件中配置
B. hdfs元数据文件存放路径在hdfs-site.xml 文件中配置
C. hdfs文件的副本数在core-site.xml 文件配置
D. 格式化HDFS系统命令:hdfs namenode -format
正确答案: ABD -
下列Hadoop叙述正确是:
A. 2008年4月,Hadoop打破世界纪录,成为最快排序1TB数据的系统
B. 在2009年5月,Hadoop更是把1TB数据排序时间缩短到62秒
C. HDFS是BigTable的开源实现
D. 第二代Hadoop包含两个版本,分别是0.23.x和2.x,这是一套全新的架构,包含HDFS Federation和YARN两个系统
正确答案: ABD -
选择 Hadoop版本,一般需要考虑哪些因素:
A. 是否开源
B. 是否有强大社区支持
C. 是否有稳定版本
D. 是否是最新版本
正确答案: ABC -
下列关于Hadoop特性叙述正确的是:
A. 仅支持Java编程语言,具有跨平台特性
B. 高可扩展性
C. 高容错性
D. 高可靠性
正确答案: BCD -
Hadoop集群配置文件主要包括:
A. core-site.xml
B. hdfs-site.xml
C. yarn-site.xml
D. mapred-site.xml
正确答案: ABCD -
Hadoop的安装部署的模式包括哪几种:
A. 独立模式(本地模式)
B. 伪分布模式
C. 集中模式
D. 完全分布模式
正确答案: ABD
填空题
-
Linux下_____命令用于拷贝文件,若拷贝的对象为目录,则需要使用-r参数。
正确答案:cp -
Linux下_____命令用于查看文件与目录。
正确答案:ls -
Linux下_____命令用于查看文本文件内容。
正确答案:cat -
_____命令用于查看服务器IP配置。
正确答案:ifconfig -
Linux下_____命令用于删除文件,若删除的对象为目录,则需要使用-r。
正确答案:rm
更多推荐
【大数据分布并行处理】单元测试(二)
发布评论