M语言数据预处理
2021/2/24
1集成数据
目录认识Power Query和M语言
powerbi官方电脑版下载
2清洗数据
3
ØPower Query是一种用于数据抽取(Data E xtraction)、数据转换(Data T ransformation)和数据加载(Data L oading)的数据预处理工具。
Ø数据抽取、数据转换和数据加载这3种操作在数据分析可以简称为ETL。通常情况下,在整个数据分析项目中,ETL会占据约三分之一的时间。
Ø在数据抽取阶段,经常会处理不同数据源的数据,这时需要完成集成数据任务。
Ø在数据转换阶段,需要处理不完整数据、含噪声的数据和不一致的数据,同时将数据转换成方便后期分析的格式,这时需要完成清洗数据、变换数据和归约数据等任务。
Ø最后这些处理好的数据加载到数据仓库。Ø各数据任务并没有固定的先后顺序。
ØPower Query适用于Excel 2010以上版本,在Excel 2010以及Excel 2013中需要下载插件安装加载后使用,在Excel 2016版本中,Power Query被内置在“数据”选项卡的“新建查询”命令中(Power Query在Excel 2016中称为“获取和转换”),如左下图所示。而在Power BI中则通过“开始”选项卡的“外部数据”组中的“编辑查询”命令实现Power Query的所有功能,如右下图所示。