人工智能机器学习技术练习(习题卷19)
第1部分:单项选择题,共58题,每题只有一个正确答案,多选或少选均不得分。
1.[单选题]最佳分类是曲线下区域面积最大者,而黄线在曲线下面积最大.2、假设你在测试逻辑回归分类器,设函数H为
class="fr-fic fr-fil fr-dib cursor-hover">
下图中的哪一个代表上述分类器给出的决策边界?
A)
class="fr-fic fr-fil fr-dib">
B)
numpy库不具有的功能有
class="fr-fic fr-fil fr-dib">
C)
class="fr-fic fr-fil fr-dib">
答案:B
解析:选项B正确。虽然我们的式子由选项A和选项B所示的y = g(-6 + x2)表示,但是选项B才是正确的答案,因为当将x2 = 6的值放在等式中时,要使y = g(0)就意味着y = 0.5将在线上,如果你将x2的值增加到大于6,你会得到负值,所以输出将是区域y = 0。
B)tanh
C)relu
答案:A
解析:
3.[单选题](__)是指对已有数据在尽量少的先验假设条件下进行探索,并通过作图,制表等手段探索数据结构和规律的一种方法。
A)统计分析
B)验证性分析
C)数据洞见
D)探索性数据分析
答案:D
解析:
4.[单选题]以下哪项关于决策树的说法是错误的()。
A)冗余属性不会对决策树的准确率造成不利的影响
B)子树可能在决策树中重复多次
C)决策树算法对于噪声的干扰非常敏感
D)寻最佳决策树是 NP完全问题
答案:C
解析:决策树算法对于噪声的干扰具有相当好的鲁棒性。
5.[单选题]可分解为偏差、方差与噪声之和的是()。
A)训练误差(training error)
B)经验误差(empirical error)
C)均方误差(mean squared error)
D)泛化误差(generalization error)
答案:D
解析:泛化误差可分解为偏差、方差与噪声之和。
6.[单选题]K-Means(聚类)算法基于距离来度量实例间的相似程度(与kNN算法一样),然后把较为相似的实例划分到同一簇。下列说法中,不正确的是:
A)聚类属于有监督式学习
B)聚类属于无监督式学习
C)K-Means算法基于距离来度量实例间的相似程度,通过对无标记样本的学习来揭示蕴含于数据中的性质及规律
D)聚类算法的任务是根据数据特征将数据集相似的数据划分到同一簇
答案:A
解析:
7.[单选题]SVM(支持向量机)与LR(逻辑回归)的数学本质上的区别是什么?
A)损失函数
B)是否有核技巧
C)是否支持多分类
D)其余选项皆错
答案:A
解析:LR的损失函数从最大似然的角度理解;SVM损失函数的原始形式则是从最大化分类间隔的角度出发。
8.[单选题]下列度量不具有反演性的是
D)兴趣因子
答案:D
解析:
9.[单选题]影响深度卷积神经网络算法的关键参数是()
A)网站数量
B)网络深度
C)网络结构
D)网络主体
答案:B
解析:
10.[单选题]对主成分分析PCA方法描述正确的是:
A)投影矩阵是正交矩阵
B)进行非正交投影
C)PCA不需要进行样本去均值
D)投影到特征值最小的方向
答案:A
解析:
11.[单选题]根据DIKW信息、数据、知识、智慧模型,以下说法错误的是
A)数据是记录下来可以被鉴别的符号,它是最原始的素材,未被加工解释,没有回答特定的问题,没有任何意义
B)信息是已经被处理、具有逻辑关系的数据,是对数据的解释,这种信息对其接收者具有意义
C)知识是从相关信息中过滤、提炼及加工而得到的有用资料,不能从知识中产生新的知识
D)智慧是人类所表现出来的一种独有的能力,主要表现为收集、加工、应用、传播知识的能力,以及对事物发展的前瞻性看法
答案:C
解析:
12.[单选题]从学科定位来看,数据科学处于(__)三大领域的重叠之处。
A)统计学
B)黑客精神与技能
C)数学与统计知识
D)领域务实知识
答案:A
解析:
13.[单选题]层次聚类试图在不同层次上对数据集进行划分,从而形成(__)形结构。
A)图
B)环
C)网
D)树
答案:D
解析:
14.[单选题]根据数据管理计划,设计或选择具体方法实行计划中的工作内容,属于数据治理的哪一步()
A)计划
B)执行
解析:
15.[单选题]下列可以用隐马尔可夫模型来分析的是?
A)基因序列数据
B)电影评论数据
C)股价数据
D)以上三种
答案:D
解析:三种都是时间序列数据,可以应用隐马尔可夫模型。
16.[单选题]以下关于归纳偏好描述错误的是(___)。
A)不是每一个有效的机器学习算法必有其归纳偏好
B)归纳偏好可看做学习算法自身在一个可能很庞大的假设空间中对假设进行选择的启发式或“价值观”
C)归纳偏好对应了学习算法本身所做出的的关于“什么样的模型更好”的假设
D)如果没有归纳偏好,学习算法在每次进行预测时将随机抽选训练集上的等效假设
答案:A
解析:
17.[单选题]半监督支持向量机中最著名的是TSVM(Transductive Support Vector Machine)。与标准SVM一样,TSVM也是针对()问题的学习方法?
A)分类
B)回归
C)聚类
D)二分类
答案:D
解析:
18.[单选题]以下关于神经网络的说法中,正确的是()?
A)增加网络层数,一定能减小训练集错误率
B)减小网络层数,一定能减小测试集错误率
C)增加网络层数,可能增加测试集错误率
D)增加网络层数,一定增加测试集错误率
答案:C
解析:
19.[单选题]以下()是 Python 中的二维图形包。
A)Matplotlib
B)Pandas
C)NumPy
D)BoKeh
答案:A
解析:
20.[单选题]下列属于无监督学习的是:
A)k-means
B)SVM
C)最大熵
D)CRF
21.[单选题]下面不属于探索性统计中常用集中趋势统计量的是(__)。
A)和
B)方差
C)平均数
D)四分位数
答案:B
解析:
22.[单选题]RGB彩空间转到GRAY彩空间的转换码为()。
A)cv2.COLOR_BGR2GRAY
B)cv2.COLOR_RGB2GRAY
C)cv2.COLOR_RGBGRAY
D)cv2.COLOR_BGRGRAY
答案:B
解析:
23.[单选题]支持向量机的优化问题是最小化的平方,这实现了(__)。
A)几何间隔为1/的最大间隔超平面
B)几何间隔为的最大间隔超平面
C)几何间隔为1/的最小间隔超平面
D)几何间隔为的最小间隔超平面
答案:A
解析:
24.[单选题]唤醒功能作为麦克风阵列技术中重要的一环,误唤醒率指标是低 于( )次/天? [] *
A)1
B)2
C)3
D)0.5
答案:A
解析:
25.[单选题]哪个不是本地模式运行的条件 ()。
A)abled=true
B)显式指定本地运行
C)finalStage无父Stage
D)partition默认值
答案:D
解析:
26.[单选题]在支持向量机中,()允许支持向量机在一些样本上出错。
A)硬间隔
B)软间隔
C)核函数
D)拉格朗日乘子法
答案:B
解析:在支持向量机中,软间隔允许支持向量机在一些样本上出错。