从零开始学python数据分析与挖掘
⽬  录
第1章  数据分析与挖掘概述
1.1  什么是数据分析和挖掘
1.2  数据分析与挖掘的应⽤领域
1.2.1  电商领域——发现破坏规则的“害之马”
1.2.2  交通出⾏领域——为打车平台进⾏私⼈订制
1.2.3  医疗健康领域——到最佳医疗⽅案
1.3  数据分析与挖掘的区别
1.4  数据挖掘的流程
1.4.1  明确⽬标
1.4.2  数据搜集
1.4.3  数据清洗
1.4.4  构建模型
1.4.5  模型评估
1.4.6  应⽤部署
1.5  常⽤的数据分析与挖掘⼯具
1.6  本章⼩结
第2章  从收⼊的预测分析开始
2.1  下载与安装Anoconda
2.1.1  基于Windows系统安装
2.1.2  基于Mac系统安装
2.1.3  基于Linux系统安装
2.2  基于Python的案例实战
2.2.1  数据的预处理
2.2.2  数据的探索性分析
2.2.3  数据建模
2.3  本章⼩结
第3章  Python快速⼊门
3.1  数据结构及⽅法
3.1.1  列表
3.1.2  元组
3.1.3  字典
3.2  控制流
3.2.1  if分⽀
3.2.2  for循环
3.2.3  while循环
3.3  字符串处理⽅法
3.3.1  字符串的常⽤⽅法
3.3.2  正则表达式
3.4  ⾃定义函数
3.4.1  ⾃定义函数语法
3.4.2  ⾃定义函数的⼏种参数
3.5  ⼀个爬⾍案例
3.6  本章⼩结
第4章  Python数值计算⼯具——Numpy 4.1  数组的创建与操作
4.1.1  数组的创建
4.1.2  数组元素的获取
4.1.3  数组的常⽤属性
4.1.4  数组的形状处理
4.2  数组的基本运算符
4.2.1  四则运算
4.2.2  ⽐较运算
4.2.3  ⼴播运算
4.3  常⽤的数学和统计函数
4.4  线性代数的相关计算
4.4.1  矩阵乘法
4.4.2  diag函数的使⽤
4.4.3  特征根与特征向量
4.4.4  多元线性回归模型的解
4.4.5  多元⼀次⽅程组的求解
4.4.6  范数的计算
4.5  伪随机数的⽣成
4.6  本章⼩结
第5章  Python数据处理⼯具——Pandas 5.1  序列与数据框的构造
5.1.1  构造序列
5.1.2  构造数据框
5.2  外部数据的读取
5.2.1  ⽂本⽂件的读取
5.2.2  电⼦表格的读取
5.2.3  数据库数据的读取
5.3  数据类型转换及描述统计
5.4  字符与⽇期数据的处理
5.5  常⽤的数据清洗⽅法
5.5.1  重复观测处理
5.5.2  缺失值处理
5.5.3  异常值处理
5.6  数据⼦集的获取
5.7  透视表功能
5.8  表之间的合并与连接
5.9  分组聚合操作
5.10  本章⼩结
第6章  Python数据可视化
6.1  离散型变量的可视化
6.1.1  饼图
6.1.2  条形图
6.2  数值型变量的可视化
6.2.1  直⽅图与核密度曲线
6.2.2  箱线图
6.2.3  ⼩提琴图
6.2.4  折线图
6.3  关系型数据的可视化
6.3.1  散点图
6.3.2  ⽓泡图
6.3.3  热⼒图
6.4  多个图形的合并
6.5  本章⼩结
第7章  线性回归预测模型
7.1  ⼀元线性回归模型
7.2  多元线性回归模型
7.2.1  回归模型的参数求解
7.2.2  回归模型的预测
7.3  回归模型的假设检验
7.3.1  模型的显著性检验——F检验
7.3.2  回归系数的显著性检验——t检验7.4  回归模型的诊断
7.4.1  正态性检验
7.4.2  多重共线性检验
7.4.3  线性相关性检验
7.4.4  异常值检验
7.4.5  独⽴性检验
7.4.6  ⽅差齐性检验
7.5  本章⼩结
第8章  岭回归与LASSO回归模型
8.1  岭回归模型
8.1.1  参数求解
8.1.2  系数求解的⼏何意义
8.2  岭回归模型的应⽤
8.2.1  可视化⽅法确定?值
8.2.2  交叉验证法确定?值
8.2.3  模型的预测
8.3  LASSO回归模型
8.3.1  参数求解
8.3.2  系数求解的⼏何意义
关于python的书
8.4  LASSO回归模型的应⽤
8.4.1  可视化⽅法确定?值
8.4.2  交叉验证法确定?值
8.4.3  模型的预测
8.5  本章⼩结
第9章  Logistic回归分类模型
9.1  Logistic模型的构建
9.1.1  Logistic模型的参数求解
9.1.2  Logistic模型的参数解释 9.2  分类模型的评估⽅法
9.2.1  混淆矩阵
9.2.2  ROC曲线
9.2.3  K-S曲线
9.3  Logistic回归模型的应⽤
9.3.1  模型的构建
9.3.2  模型的预测
9.3.3  模型的评估
9.4  本章⼩结
第10章  决策树与随机森林
10.1  节点字段的选择
10.1.1  信息增益
10.1.2  信息增益率
10.1.3  基尼指数
10.2  决策树的剪枝
10.2.1  误差降低剪枝法
10.2.2  悲观剪枝法
10.2.3  代价复杂度剪枝法
10.3  随机森林