bootstrap自采样是一种广泛应用于统计学中的方法,通过从原始数据中抽取一定量的样本(即子集),并对抽取的样本进行统计学分析,可以对其进行多种处理,包括logistic回归分析。
具体而言,bootstrap自采样在logistic回归验证中的应用方法如下:
1. 从原始数据中抽取k个样本,可以理解为从这n个观察值中,有放回的随机抽取k个样本。
2. 利用抽取的k个样本,构建一个logistic回归模型。
bootstrap 5
3. 使用这个模型对每一个原始数据进行预测,得到预测的概率值。
4. 将预测的概率值和实际的标签进行对比,计算出误差平方和。
5. 重复上述步骤m次(m大于等于500次),得到m个误差平方和。
6. 对这m个误差平方和进行排序,得到p值。
7. 根据p值判断模型的预测效果。
值得注意的是,在logistic回归模型中,bootstrap自采样不能直接用于AUC的计算,因为AUC
是基于ROC曲线下的面积计算的,而ROC曲线需要按照实际的标签来绘制。因此,在计算AUC时,不能简单地将模型预测的概率值直接代入计算公式中。但是,通过bootstrap自采样可以得到概率值的分布情况,从而可以计算出AUC的置信区间。