大数据基础理论知识考核
一、选择题
1.下列说法正确的是()[单选题] *
A.在使用KNN算法时.
B.KNN是有监督学习算法
C.在使用KNN算法时.上取值越大.模型越容易过拟合
D.KNN和K-means都是无监督学习算法
2.下列关于决策树的说法错误的是( )。[单选题] *
A.冗余属性不会对决策树的准确率造成不利的影响
B.子树可能在决策树中重复多次
C.决策树算法对于噪声的干扰非常敏感
D.寻最佳决策树是NP完全问题
3.相关关系是一种与函数关系区别的非确定性关系,而相关分析就是研究事物或现象之间是否存在这种非确定性关系的统计方法,下列不属于相关性分析方法的是()。[单选题] *
A.Pearson相关系数
B.Spearman秩相关系数
C.Kendall相关系数
D.傅里叶系数
4.信息增益、增益率分别对可取值数目( )的属性有所偏好。[单选题] *
A.较高.较高
B.较高.较低
C.较低.较高
D.较低.较低
5. LSTM中,( )的作用是确定哪些新的信息留在细胞状态中,并更新细胞状态。[单选题] *
A.输入门
B.遗忘门
C.输出门
D.更新门
6.傅里叶变换得到的频谱中,低频系数对应于( )o[单选题] *
A.物体边缘
B.噪声
C.变化平缓部分
D.变化剧烈部分
7.数据科学基本原则中,基于数据的智能的主要特点是()。[单选题] *
A.数据简单,但算法简单
B.数据复杂,但算法简单
C.数据简单,但算法复杂
D.数据复杂,但算法复杂
8. Sigmoid函数作为神经元激活函数的特点是( )。[单选题] *
A.连续但不光滑
B.不连续但光滑
C.连续且光滑
D.不连续且不光滑
9.离散程度的测度值愈大,则()。[单选题] *
A.反映变量值愈分散.算术平均数代表性愈差
B.反映变量值愈集中.算术平均数代表性愈差取整函数int怎么取整
C.反映变量值愈分散.算术平均数代表性愈好
D.反映变量值愈集中.算术平均数代表性愈好
10.当构建一个神经网络进行图片的语义分割时,通常采用的顺序是( )o[单选题] *
A. 先用卷积神经网络处理输入,再用反卷积神经网络得到输出
A. 先用反卷积神经网络处理输入,再用卷积神经网络得到输出
A. 不能确定源代码编程软件
11.给定词汇表如下:(Bob, ok, likes, football, car}o 则下面句子 Bob likes football的词袋模型表示为( )o[单选题] *
A. [1 1 1 00]
B. [1 0 1 1 0]
C. [100 10]
D. [0 1 1 0 1]
ant design vue312.BASE原则的含义不包括()。[单选题] *
A.基本可用
B.柔性状态
C.最终一致
D.基础条件
13. 标准BP算法的目标是使训练集上的( )最小。[单选题] *
核酸结果null啥意思A.累积方差
B.累积误差
C.累积协方差
D.累积偏差
14. DNN常用的激活函数有()o[单选题] *
A.sigmoid
B.tanh
C.ReLU
D.以上答案都正确active公司
15.Spark比MapReduce快的原因不包括([单选题] *
A.Spark基于内存迭代,而MapReduce基于磁盘迭代
B.DAG计算模型比MapReduce更有效率
C.Spark是粗粒度的资源调度,而MapReduce是细粒度的资源调度
D.Spark支持交互式处理,MapReduce善于处理流计算
16.在训练的每一轮都要检查当前生成的基学习器是否满足基本条件的算法是( )。[单选题] *
A.支持向量机
B. Boosting算法
C.贝叶斯分类器
D. Bagging算法
17.()肯定是宽依赖操作。[单选题] *
A. map
B. flatMap
C. reduceByKey
D. sample
18.当合适的样本容量很难确定时,可以使用的抽样方法是()。[单选题] *
A.有放回的简单随机抽样
B.无放回的简单随机抽样
C.分层抽样
D.渐进抽样
19.可用信息增益来进行决策树的( )。[单选题] *
A.树高
B.叶子结点数
C.总结点数
D.划分属性选择python基础知识单选题