07
高级数据建模分析
Python数据处理、分析、可视化与数据化运营
本章学习目标
了解常用的数据挖掘和机器学习算法的概念和应用场景掌握运用常见机器学习算法解决实际项目问题的能力
掌握不同算法评估的主要方法
熟悉常见的用于机器学习的数据预处理工作和技巧
了解如何将机器学习与日常应用结合并推动结果落地
掌握如何通过可视化展示机器学习结果的方法
算法引言
聚类的概念python可以做什么游戏
q聚类是数据挖掘和计算的基本任务,它将大量数据集中具有“相似”特征的数据点或样本划分为一个类别。
q聚类分析的基本思想是“物以类聚、人以分”,因此大量的数据集中必然存在相似的数据样本,基于这个假设就可以将数据区分出来,并发现不同类的特征。
算法引言
聚类的应用场景
q聚类常用于数据探索或挖掘前期,在没有做先验经验的背景下做的探索性分析
q也适用于样本量较大情况下的数据预处理工作。
算法引言
聚类的常用算法
q基于划分、层次、密度、网格、统计学、模型等类型的算法
q典型算法包括K均值(经典的聚类算法)、DBSCAN、两步聚类、BIRCH、谱聚类等