“曙光瑞翼杯”大数据知识竞赛试题
2018年度
一、单选题(每题1分
1、小米摄像头记录下来的10分钟视频属于哪类数据:
A、结构化数据  B、半结构化数据  C、非结构化数据
2、结构化数据具备哪种特征:
A、具备明确逻辑关系    B、不具备明确逻辑关系    C、不一定具备明确逻辑关系
3、指纹打卡的数据属于哪些数据:
A、传感数据  B、交互数据  C、交易数据
4、大数据擅长处理哪个级别的数据?
A、MB    B、GB    C、TB    D、PB
5、是什么类型数据:
A、非结构化数据    B、结构化数据    C、半结构化数据
6、网络新闻是什么类型数据:
A、非结构化数据    B、结构化数据    C、半结构化数据
7、下列属于结构化数据的是:
A、图片        B、一卡通学生信息      C、简历
8、表1属于几维列表?
姓名
性别
学号
年级
成绩
hbase属于什么类型数据库张三
2016130133
2016
80
李四
2016131038
2016
60
                                表1
A、二维          B、三维          C、四维          D、五维
9、图1中的级别属于哪种属性?
                                图1
A、标称属性      B、二元属性      C、序数属性      D、数值属性
10、关系型数据库中所谓的“关系”是指什么
A、数据库中的数据彼此间存在任意关联
B、数据模型满足一定条件的二维表格式
C、两个数据库之间有一定的关联
11、下列哪种数据类型不适合MySQL存储:
A、EXCEL报表      B、图片和声音            C、数据库里的财务数据
12、以下不属于ACID原则的是:
A、原子性          B、相对性            C、隔离性          D、 持久性
13、淘宝自主设计的自动化分布式存储系统是:
A、MongoDB          B、HBase            C、Oceanbase
14、BeansDB 是一个由我国哪个自主开发的:
A、淘宝        B、豆瓣社区        C、优酷        D、视觉中国
15、下列不是NewSQL数据库的是:
A、Sybase          B、MemSQL          C、TokuDB
16、下列不是NoSQL数据库的是:
A、Bigtable        B、Dynamo          C、DB2
17、下列不是传统关系型数据库的是:
A、MySQL          B、HBase        C、Sybase
18、下面关于数据挖掘的说法哪些是错误的:
A、数据挖掘涉及数据融合、数据分析和决策分析和决策支持等内容
B、数据源必须是真实的、大量的、含有噪声的和用户感兴趣的数据
C、所有发现的知识都是绝对的
19、下列不属于数据挖掘知识的方法
A、数学方法            B、归纳方法          C、实验方法
20、一般情况下,舆情监测内容不包含:
A、对主流门户网站、国内外主流论坛、主流媒体、主流搜索引擎等站点进行全景扫描
B、对单位相关刑事、民事、行政案件与信息进行全面收集、精确分析、清晰归类和个性统计
C、对个人或家成员庭银行帐户及个人财产情况进行全面收集、分析和统计
21、科学可视化、信息可视化和可视分析三者之间如何区分:
A、三者从属关系        B、三者属于递进关系            C、三者之间没有清晰边界
22、下列哪个不属于可视化的作用:
A、信息传播与协调      B、支持对信息的推理和分析      C、对信息进行筛选和储存
23、下图为百度地图显示某地区的加油站,此图为哪类可视化:
A、层次与网络可视化        B、时空数据可视化          C、多变量数据可视化 
24、下图为伦敦地铁图,此图为哪类可视化:
A、层次与网络可视化          B、时空数据可视化          C、多变量数据可视化 
25、下图为大数据标签云,此图为哪类可视化:
A、多变量数据可视化      B、时空数据可视化      C、非结构化数据可视化
26、目前在全球云计算市场份额占有率最高的公司是:
A、谷歌        B、亚马逊          C、微软        D、IBM
27、在大数据背景下,电子商务的价值创造方式呈现出新的变化,下列说法错误的是:
A、电子商务营销精准化和实时化
B、产品和服务高度差异化和个性化
C、价值链上企业运作差异化和静态化
D、新型增值服务模式不断涌现
28、下列哪个不是大数据下互联网广告的特点
A、广告内容更有针对性
B、提高广告决策效率
C、广告以平面媒体为主
D、广告传播模式的改变
29、朋友圈的FEED流广告的推广更为准确描述是:
A、大数据会使受众与产品的距离更贴近
B、对于目标受众的划分更加精细
C、大数据最本质的应用就在于预测
D、随意投放的广告
30、啤酒与尿布的营销案例应用了零售行业的哪种方法:
A、发现关联购买行为      B、客户体细分          C、供应链管理
二、多选题(每题2分
1.Hadoop1.0平台最核心的两个项目(组件)是:
A、HDFS      B、HIVE          C、HBase        D、MapReduce
2.以下平台属于Apache软件基金会项目的是:
A、Hadoop      B、Spark          C、Storm        D、MongoDB
3.以下属于大数据挖掘算法的是:
A、决策树      B、支持向量机          C、极差规格化      D、朴素贝叶斯
4.以下属于Spark平台特点的是:
A、共享变量      B、离线处理          C、内存计算      D、弹性分布式数据集
5.在分布式云计算平台中,分布式文件系统的块文件的大小可以是:
A、28M      B、64M          C、100M      D、128M