BootStrap统计分析浅析
Bootstrap 分析⽅式属于⼀种⽆参数分析⽅法。主要是为了⽤经验分布代替真正的分布。
主要依赖对观测到的样本的重新抽样。
具体来说:
Bootstrap⽅法从观察数据出发,不需任何分布假定,针对统计学中的参数估计及假设检验问题,利⽤Bootstrap⽅法产⽣的⾃举样本计算的某统计量的数据集可以⽤来反映该统计量的抽样分布,即产⽣经验分布,这样,即使我们对总体分布不确定,也可以近似估计出该统计量及其置信区间,由此分布可得到不同置信⽔平相应的分位数——即为通常所谓的临界值,可进⼀步⽤于假设测验。因⽽,Bootstrap⽅法能够解决许多传统统计分析⽅法不能解决的问题。在Bootstrap的实现过程中,计算机的地位不容忽视(Diaconis et al.,1983),因为Bootstrap涉及到⼤量的模拟计算。可以说如果没有计算机,Bootstrap理论只可能是⼀纸空谈。随着计算机的快速发展,计算速度的提⾼,计算费时⼤⼤降低。在数据的分布假设太牵强或者解析式太难推导时,Bootstrap为我们提供了解决问题的另⼀种有效的思路。因此,该⽅法在⽣物科学研究中有⼀定的利⽤价值和实际意义
  ⾮参数统计中⼀种重要的估计统计量⽅差进⽽进⾏区间估计的统计⽅法,也称为⾃助法.其核⼼思想和基本步骤如下:
(1) 采⽤重抽样技术从原始样本中抽取⼀定数量(⾃⼰给定)的样本,此过程允许重复抽样.
bootstrap检验方法
(2) 根据抽出的样本计算给定的统计量T.
(3) 重复上述N次(⼀般⼤于1000),得到N个统计量T.
(4) 计算上述N个统计量T的样本⽅差,得到统计量的⽅差.
应该说Bootstrap是现代统计学较为流⾏的⼀种统计⽅法,在⼩样本时效果很好.通过⽅差的估计可以构造置信区间等,其运⽤范围得到进⼀步延伸.
具体抽样⽅法举例:想要知道池塘⾥⾯鱼的数量,可以先抽取N条鱼,做上记号,放回池塘.
进⾏重复抽样,抽取M次,每次抽取N条,考察每次抽到的鱼当中有记号的⽐例,综合M次的⽐例,在进⾏统计量的计算.。