大数据开发基础(习题卷6)
第1部分:单项选择题,共57题,每题只有一个正确答案,多选或少选均不得分。
1.[单选题]Hive的查询语言HQL(Hive SQL)支持( )标准,使得HQL非常类似SQL
A)SQL-90
B)SQL-91
C)SQL-92
D)SQL-93
答案:C
解析:
2.[单选题]下列代码中绘制散点图的是()。
A)plt.scatter(x,y )
B)plt.plot(x,y )
C)plt.legend('upper left)
D)plt.xlabel(散点图")
答案:A
解析:
3.[单选题]触发器不是响应以下哪一语句而自动执行的Mysql语句
A)select
B)insert
C)delete
D)update
答案:A
解析:
4.[单选题]python不支持的数据类型有()
A)char
B)int
C)float
D)list
答案:A
解析:
5.[单选题]一个输入为(32,32,3)的数据集,通过一个大小为2×2的不重叠最大池化层,输出( )。
A)(28,28,8)
B)(16,16,8)
hbase的特性有哪些
C)(28,28,3)
D)(16,16,3)
答案:D
解析:
6.[单选题]下面关于数据查询的描述正确的是( )。--
A)查询数据的条件仅能实现相等的判断
B)查询的数据必须包括表中的所有字段
C)星号“*”通配符代替数据表中的所有字段名
D)以上答案都正确
答案:C
解析:
7.[单选题]ADS中创建事实表(普通表)时会有一些限制,下列( )说法是错误的。
A)表的名字不能超过32个字符
B)一个事实表最多不能超过1024列
C)至少有一级Hash分区
D)二级分区只能是Hash或List
答案:D
解析:
8.[单选题]下列选项中,( )的布尔值不是False。
A)None
B)0
C)()
D)1
答案:D
解析:
9.[单选题]在页面中看不见的表单元素是( )。
A)<input type="password"></input>
B)<input type="radio"></input>
C)<input type="hidden"></input>
D)<input type="reset"></input>
答案:C
解析:注意关键词 hidden。
10.[单选题]对于HBase表设计描述错误的是?
A)一张表可以创建多个 Column Family
B)TTL默认为一天
C)Region建议预先创建
D)Max Version无法人为修改
答案:D
解析:
11.[单选题]下面哪项操作能实现跟神经网络中Dropout的类似效果?
A)Boosting
B)bagging
C)Stacking
D)Mapping
答案:B
解析:
12.[单选题]下列关于 HBase 的集结构描述有误的是()
A)HBase 的服务器体系结构遵从简单的主/从服务器架构,它由 HRegion Server 和 HBase Master Server 构成。
B)当表的大小超过设置的值时,HBase 会自动地将表划分为不同的区域,每个区域包含所有行的子集。
C)HBase 逻辑上的表可能会被划分成多个 HRegion,然后存储到 HRegion Server 中。
D)ZooKeeper 本身并不存储 HBase 中的任何数据,它存储的是从数据到 HRegion Server 的映射, 告诉每台 HRegion Server 它要维护哪些 HRegion。
答案:D
解析:
13.[单选题]部署 FusionInsight HD 时,同一集内的 Flume Server 节点建议至少部署几个?
A)1
B)3
C)4
D)2
答案:D
解析:
14.[单选题]如果想给变量赋值,则使用()
A)=
B)C)>>
D)==
答案:A
解析:
15.[单选题]计算之树中,通用计算环境的演化思维是怎么概括的( )
A)元器件--由电子管、晶体管到集成电路、大规模集成电路和超大规模集成电路
B)程序执行环境--由CPU-内存环境,到CPU-存储体系环境,到多CPU-多存储器环境,再到云计算虚拟存储环境
C)网络运行环境--由个人计算机到局域网、广域网再到Internet
D)以上三个说法都不对
答案:B
解析:
16.[单选题]大数据在餐饮行业的应用不包括以下哪项?()
A)大数据驱动的团购模式
B)利用大数据为用户推荐消费内容
C)利用大数据调整线下门店布局
D)利用大数据控制消费人的口味喜好
答案:D
解析:
17.[单选题]大数据服务(MaxCompute,原ODPS)中客户表customer是一张非分区表,现在想要清空表的内容然后重新上传数据,可以通过:( )。
A)insert overwrite table customer select * from customer;
B)delete from customer;
C)truncate table customer;
D)drop table customer;
答案:A
解析:
18.[单选题]( )是指个体对视觉感知信息的进一步加工处理过程,包括视觉信息的抽取、转换、存储、简化、合并、理解和决策加工活动。
A)视觉感知
B)视觉认知
C)视觉编码
D)视觉转换
答案:B
解析:视觉感知(Visual Perception)是指客观事物通过视觉感觉器官(眼睛等)在人脑中产生直接反应的过程。视觉感知是产生视觉认知的前提条件。视觉认知(Visual Cognition)是指个体对视觉感知信息的进一步加工处理过程,包
括视觉信息的抽取、转换、存储、简化、合并、理解和决策等加工活动。
19.[单选题]下面关于推荐系统的描述错误的是:()
A)推荐系统是自动联系用户和物品的一种工具
B)和搜索引擎相比.推荐系统通过研究用户的兴趣偏好,进行个性化计算
C)推荐系统可发现用户的兴趣点,帮助用户从海量信息中去发掘自己潜在的需求
D)推荐系统是一种只能通过专家进行人工推荐的系统
答案:D
解析:
20.[单选题]对融合数仓解决方案描述正确的是?
A)数仓与大数据的并行架构
B)低成本高扩震性的传统数仓架构
C)以数仓为核心,大数据平台为延伸的融合架构
D)大数据平台为核心的架构
答案:C
解析:
21.[单选题]关闭Spark集,需要cd到spark目录下的sbin目录,然后执行(__)脚本即可。
A)all-stop.sh
B)stopall.sh
C)stop.sh
D)stop-all.sh
答案:D
解析:
22.[单选题]当数据集非常大的时候,对全体数据进行处理存在困难时,通过什么方式可以估计和推断出整体的特性()
A)抽样查询
B)模糊查询
C)条件查询
D)连接查询
答案:A
解析:
23.[单选题]ID、F 采用了 IWF 的几次平方?()
A)、一次
B)、二次
C)、三次
D)、四次
答案:A
解析:
24.[单选题]图灵奖获得者 JimGray提出的"科学研究第四范式"的全称为()。
A)数据密集型科学发现
B)以数据为中心的科学发现,
C)数据驱动型的科学发现
D)大数据科学研究
答案:A
解析:2007年,图灵奖获得者 Jim Gray提出了科学研究的第四范式--数据密集型科学发现(Data-intensive Scientific Discovery)。在他看来,人类科学研究活动已经历过三种不同范式的演变过程(原始社会的"实验科学范式"、以模型和归
纳为特征的"理论科学范式"和以模拟仿真为特征的"计算科学范式"),目前正在从"计算科学范式"转向"数据密集型科学发现范式"。
25.[单选题]Hbase的某张表的RowKey划分Splitkey为 9.请问表里面有( )个Region。
A)6
B)5
C)4
D)3
答案:B
解析:
26.[单选题]物联网(IoT,Internet of Things)即“物物相连的互联网”,是()向物理世界的渗透、拓展和延伸。
A)物理理论
B)信息世界
C)互联网
D)能源互联网
答案:C
解析:
27.[单选题]Hive在处理数据时,默认的分隔map元素的key和value的分隔符是( )
A)^A
B)^B
C)^C
D)\n
答案:C
解析:
28.[单选题]卷积神经网络中说的梯度下降,是指( )的梯度。
A)参数本身
B)激活函数
C)损失函数
D)图像大小
答案:C
解析:
29.[单选题]L表示模糊分类器的特征关键词,由T推导出模糊集F,以下哪个算法可以计算不同F之间的关联度?()
A)SVM
B)EWC
C)SR
D)EM
答案:C
解析:
30.[单选题]HDFS是一个( )结构。
A)端到端
B)主从
C)分布式
D)多对多
答案:B
解析: