大数据开发工程师(基础级)考试大纲Big Data Development Engineer Level I Examination Outline
BDDE考试大纲是CBDA国际认证培训中心基于大数据开发工程师等级认证标准而设定的一套科学、详细、系统的考试纲要。考纲规定并明确了BDDE大数据开发工程师认证考试的具体范围、内容和知识点,考生可按照BDDE考试大纲进行相关知识的复习。
1.大数据概念(占比2%)
2.大数据特点。(占比3%)
3.大数据处理流程(占比5%)
1.Hadoop基础(占比5%)
2.Hadoop安装配置(占比10%)
3.分布式文件系统HDFS(占比15%)
4.分布式计算框架MapReduce编程(占比40%)
1.Hive概述(占比2%)
2.Hive客户端访问(占比2%)
3.Hive数据类型(占比1%)
4.Hive DDL、DML、Select语法(占比15%)
大数据开发工程师(基础级)考试大纲解析
Big Data Development Engineer Level I Examination Note
根据BDDE大数据开发工程师认证考试大纲,泰迪智能研究院给出了详细解析,以“领会”,“熟知”,“应用”三个不同的级别将每一个知识点进行分解,建议考生应该按照不同的知识掌握程度有目的性的进行复习。
1. 领会:要求应考者能够记忆规定的有关知识点的主要内容,并能够了解规定的有关知识点的内涵与外延,了解其内容要点和它们之间的区别与联系,并能根据考核的不同要求,做出正确的解释、说明和阐述。
2. 熟知:要求应考者必须熟悉的理论知识,并能够正确理解和记忆相关的理论方法,根据考核的不同要求,做出逻辑严密的解释、说明和阐述。
3.应用:要求应考者必须掌握知识点的主要内容,并能够结合工具进行商业应用,根据考核的具体要求,做出问题的具体实施流程和策略。
Part 1:大数据基础
➢大数据概念
1.领会:大数据基本概念、起源、目标及发展历程。
2.熟知:明确大数据的基本概念、发展历程,针对大数据的起源及要解决的问题
(即目标)有一定认知。
➢大数据特点
1.领会:了解大数据特点、对比传统小数据不同之处、应用场景及行业。
2.熟知:明确大数据3V、4V特点、针对不同的特点有明确的认知,对大数据的应
用场景及行业有比较清晰的认识。
➢大数据处理流程
1.领会:大数据存储、大数据传输,大数据预处理,建模预测及评估调优。
2.熟知:明确大数据存储、传输的通用技术、大数据预处理常用过程:数据抽取、
属性选择数据质量分析、数据分布分析、数据清洗、属性变换、数据规约,根据实际业务场景对不同数据进行不同的建模及调优。
Part 2:大数据Hadoop技术
➢Hadoop基础
1.领会:了解Hadoop基本概念、发展历程。
2.熟知:明确Hadoop的特点、架构及组成。
➢Hadoop安装配置
1.领会:能进行基本的Hadoop完全分布式集安装配置、会进行基本的集启动
关闭机监控。
2.熟知:明确Hadoop各个配置文件中参数的意义。
➢分布式文件系统HDFS
1.领会:了解HDFS架构及组件构成。
2.熟知:熟练使用hdfs dfs shell、hdfs dfsadmin shell。
3.应用:针对不同的需求,使用HDFS Shell完成对应功能。
➢分布式计算框架MapReduce编程
1.领会:了解MapReduce流程:输入、分区、Mapper、Shuffle 和Sort、Reducer、
输出。
2.熟知:能进行基本的Mapper、Reducer、Driver编程。
3.应用:能根据不同的需求,编写对应的Mapper及Reducer逻辑来实现对应的功
能。
Part 3:大数据数据仓库Hive技术
➢Hive概述
1.领会:了解大数据仓库Hive的基本架构、原理和适用场景。
➢Hive客户端访问
1.领会:了解访问大数据仓库Hive的三种方式。
2.熟知:能根据不同的场景选择不同的大数据仓库访问访问。
数据库认证考试
➢Hive数据类型
1.领会:了解Hive的基本数据类型:INT、DOUBLE、STRING等。
➢Hive DDL、DML、Select语法
1.领会:了解Hive的数据定义预研基本语法、数据操作预研基本语法、查询基本语法。
2.熟知:能进行Hive建表、修改表、数据导入导出、基本查询操作。
3.应用:能根据不同需求,使用不同的命令来建立符合应用场景的Hive表或导入导出
数据。
参考资料
➢大数据时代,[英] 维克托·迈尔-舍恩伯格,[英] 肯尼思·库克耶著;盛杨燕,周涛译,浙江人民出版社
➢Hadoop权威指南,[美] 汤姆,怀特(Tom White)著;王海,华东,刘喻,吕粤海译,清华大学出版社
➢Hadoop大数据分析与挖掘实战,张良均樊哲赵云龙李成华著,机械工业出版社
➢Hadoop与大数据挖掘,张良均樊哲位文超刘名军等著,机械工业出版社
➢Hadoop大数据开发基础,余明辉张良均著,人民邮电出版社
➢Hive编程指南,[美] Edward Capriolo,Dean Wampler,Jason Rutherglen 著;曹坤译,人民邮电出版社
大数据开发工程师(专业级)考试大纲Big Data Development Engineer Level II Examination Outline BDDE考试大纲是CBDA国际认证培训中心基于大数据开发工程师等级认证标准而设定的一套科学、详
细、系统的考试纲要。考纲规定并明确了BDDE大数据开发工程师认证考试的具体范围、内容和知识点,考生可按照BDDE考试大纲进行相关知识的复习。
1.Hadoop集调优(占比5%)
2.分布式文件系统HDFS Java API操作(占比5%)
3.分布式计算框架MapReduce编程(占比20%)
1.Hive 复杂DDL、DML、自定义函数语法(占比10%)
2.Hive调优(占比5%)
1.Spark基础(占比3%)
2.Spark集(占比5%)
3.Spark RDD及编程(占比20%)
4.Spark生态圈(占比15%)
1.HBase基础(占比3%)
2.HBase数据模型(占比2%)
3.MapReduce操作HBase数据(占比5%)