南开大学22春“物联网工程”《大数据开发技术(一)》期末考试高频考点版(带答案)
一.综合考核(共50题)
1.
Google Fusion Tables是哪种可视化工具()
A.信息图表
B.地图工具
C.时间线工具
D.分析工具
参考答案:B
2.
数据仓库、专家系统产生于大数据发展的成熟期。()
A.正确
B.错误
参考答案:B
3.
大一java期末考试题及答案以下哪种不属于为大数据时代提供关键技术支撑的信息科技变化()。
A.网络宽带不断增加
B.存储设备容量不断增加
C.CPU处理能大幅提升
D.存储设备尺寸不断减小
参考答案:D
4.
Hbase中Zookeeper文件记录了()的位置
A..META.表
B.-ROOT-表
C.Region
D.Master
参考答案:B
5.
MongoDB将数据存储为一个()
A.关系
B.属性
C.字段
D.文档
参考答案:D
6.
UMP系统的哪个功能实现了负载均衡()
A.读写分离
B.资源隔离
C.资源调度
D.可扩展
参考答案:A
7.
静态数据采取()计算模式
A.批量
B.实时
C.大数据
D.动态
参考答案:A
8.
行式数据库采用()存储模型。
A.NSM
B.DSM
C.Hbase
D.MySQL
参考答案:A
9.
数据产生方式的运营式系统阶段的数据产生方式是主动的。()
A.正确
B.错误
参考答案:B
10.
SQL中的table对应与MongoDB中的()
参考答案:collection/集合
11.
HDFS中()记录了每个文件中各个块所在的数据节点的位置信息
A.NameNode
B.SecondaryNameNode
C.DataNode
D.Block
参考答案:A
12.
Hadoop启动所有进程的命令为()。
A.all-start.sh
B.all-start.
C.start-all.sh
D.start-all.
参考答案:C
13.
Hbase中性能监视的工具有()。
A.Ganglia
B.Ambari
C.OpenTSDB
D.Zookeeper
参考答案:ABC
14.
以下哪些是数据可视化信息图表工具()
A.大数据魔镜
B.D3
C.Google Chart API
D.Google Fusion Tables
参考答案:ABC
15.
HDFS集中的数据节点一般是一个节点运行多个数据节点进程,负责处理文件系统客户端的读/写请求。()
T.对
F.错
参考答案:F
16.
关系数据库与NoSQL数据库相比适用于哪些领域()
A.电信
B.银行
C.互联网企业大数据处理
D.传统企业的数据分析
参考答案:AB
17.
HDFS中的NameNode的EditLog用于维护文件系统树以及文件树中所有的文件和文件夹的元数据。()
A.正确
B.错误
参考答案:B
18.
使用Amazon云环境部署Hadoop的说法中错误的是()。
A.Hadoop不仅可以运行在企业内部的集中,也可以运行在云计算环境中
B.Hadoop自带有一套脚本,用于在EC2上面运行Hadoop
C.在EC2上运行Hadoop尤其适用于一些工作流
D.Amazon EC2为Hadoop提供了存储服务
参考答案:D
19.
HDFS中SecondaryNameNode通过HTTP的()请求方式从NameNode上获取到FsImage和EditLog文件,并下载到本地的相应目录下
参考答案:Get
20.
Hadoop是典型的批处理模型。()
A.正确
B.错误
参考答案:A
21.
Amazon RDS属于()
A.关系数据库
B.键值数据库
C.NoSQL数据库
D.数据仓库
参考答案:A
22.
以下哪种数据库是针对在线业务的,并且抛弃了关系模型?()
A.MongoDB
B.MySQL
C.Oracle
D.Redis
参考答案:AD
23.
MapReduce中最优的Reduce任务个数取决于集中可用的()的数目。
A.Split
B.Slot
C.Map
D.Shuffle
参考答案:B
24.
关于MapReduce中Shuffle过程,说法错误的是()。
A.Shuffle过程中为每个Map任务分配一个缓存