CDA LEVEL1 第五章 多维数据透视分析
考试占比:
多维数据透视分析(10%)
a. 多表透视分析逻辑(占比 3%)
b. 多维数据模型(占比 3%)
c. 透视分析方法(占比 4%)
考试内容:
总体要求
理解多维数据模型价值、理解多维数据模型逻辑、理解透视分析原理、能够活用多维数据模型结合恰当透视方法观测业务问题,实现商业洞察
◆ 1、多表透视分析逻辑
【熟知】
熟知透视分析的作用价值
理解多表环境下的连接、透视逻辑
【应用】
能够通过表的字段理解该表所代表的业务维度及业务意义,能够通过表的业务意义倒推回 表中字段的主键、维度、度量属性
◆ 2、多维数据模型
【领会】
了解使用多维数据模型的业务意义
【熟知】
熟知多维数据模型的创建方法
熟知多维数据模型中连接方式与汇总结果间的关系
熟知多维数据模型下汇总维度与筛选维度间的差异及各自的适用场景
【应用】
能够通过 5W2H 思维模型梳理业务线索,搜集完整的多表数据。
能够根据业务需求,按照正确的连接关系创建完整、准确、全面的多维数据模型
能够根据多维数据模型推导出可探索的业务问题范围,实现业务洞察
◆ 3、透视分析方法
【领会】 cda数据分析师
透视分析的价值及意义
【熟知】
熟知基本透视规则:求和、求平均、计数、最大最小值
熟知条件筛选透视规则:多条件透视计算、不同层级维度透视计算
熟知基本对比计算规则:均比、基准比、标准比、百分比、差异百分比
熟知时间维度下的透视计算规则:不同时间段、不同时间位移量下的透视计算规则
熟知行间透视与字段上透视的差异
【应用】
能够根据业务需求选择创建正确的透视规则
能够将透视规则应用在正确的多维模型下描述业务问题
能够通过透视结果理解业务问题
透视结果与预期结果不符时,能够检查、追踪问题原因
知识点:
1. 多维数据模型的作用:在DW中的不同数据源间“搭桥”,让所有通过“桥梁”连接在一起的数据源能够共享彼此的数据信息,从而解决“信息孤岛”问题,为完成多维数据透视分析任务提供完整的数据集合。
2. 多维数据模型中影响连接汇总计算结果的要素主要有:筛选器的方向、对应关系及汇总角。
3. 筛选器:筛选器的方向决定了维度字段与度量字段的出处。筛选器分为两类,分别是单向筛选器及双向筛选器。连接线中间只有一个箭头的被称为单向筛选器,而连接线中间有两个箭头的被称为双向筛选器。
4. 单向筛选器:箭头出发一侧的数据表是筛选数据表,用来提供维度字段。而箭头指向一侧的数据表是被筛选数据表,用来提供度量字段。
5. 多维数据模型中的主表:在数据模型连接逻辑下,哪个表提供度量字段哪个表为主表,而另一侧的表则为附表。
6. 单向筛选器,一表筛选多表(最常用的),多表筛选一表(报错)。
7. 双向筛选器,一表筛选多表(最常用的),多表筛选一表(计算逻辑特殊,指定的维度字段并不直接对度量字段进行筛选,而是先出每个不同维度项下包含的不同的公共字段信息,再用这些公共字段信息对度量字段进行筛,结果通常不是想要的)。
8. 跨表筛选:进行跨表筛选的前提条件是筛选路径要通畅,也就是每一段路径中的筛选器中都要有指向被筛选表一侧的箭头才行。
9. 交叉连接:两表间包含多条筛选路径的情况称为交叉连接。虽然交叉连接存在多条筛选路径,但真正对汇总计算结果产生影响的路径只有一条,我们称影响筛选结果的路径为有效路径,而其余路径均不参与筛选计算,我们将这些路径称为无效路径。
10. 多表连接模式:①星型模型:一个事实表和多个维度表相连接构成的连接模型,星型模型用来为事实表丰富维度信息。②雪花模型:维度表和其他维度表连接再与事实表连接后构成的连接模型,雪花模型用来在某些特定维度信息上进行更丰富的维度信息拓展。③星座模型:多个事实表与某些维度表连接后构成的连接模型,星座模型用共用的维度表将多个不同的事实表连接为一个整体。
11. 5W2H思维模型:思维模型中的5个W分别指的是What、Why、Where、When和Who 这5个英文单词,而2个H分别指的是How much、How to do这2个英文短语。在数据分析领域中,What代表分析的对象是什么,Why代表为什么分析,Where代表分析的空间维度是什么,When代表时间纬度是什么,Who代表分析的参与角有哪些,How much代表分析的度量是什么,How to do代表该如何做。How to do是通过数据分析最终得出的见解与决策方案,是我们要分析的最终目的。在商业数据的汇总分析中,5个W开头的单词是我们汇总的维度,而How much是我们要观测的度量值,有了维度和度量,我们就可以对零散的业务数据进行行之有效的汇总观测,从而发现问题,到解决问题的方案。
12. 销售漏斗模型:科学反映商机状态及销售效率的一种重要的销售管理模型。