DOI: 10.13546/jki.tjyjc.2021.10.003mWWW)
基于Bootstrap方法的分位数估计
李莉莉,张璇,杜梅慧
(青岛大学经济学院,山东青岛266071)
摘要:分位数广泛应用于人口调查、服装设计、洪水妍究、金融风险分析方面。分位数估计的方法基本分 为两大类:一类是参数估计,另一类是非参数估计。文章运用非参数Bootstrap分位数估计研究人体测量指标,并与参数分位数估计进行比较。结果表明,利用Bootstrap抽样方法来估计分位数的结果精度较高且更加穗定。
关键词:Bootstrap抽样;分位数估计;非参数估计
中图分类号:02丨 文献标识码:A文章编号:1002-6487(2021)10-0015-05
〇引言
社会调査是指人们利用某种特殊的方式,从现实生活 中收集网络有关社会实际发生事件的信息材料,并
对其做 出描述、解释的一种自发性的社会认知活动。在实际调查 当中,统计工作者较为关心的是数据资料的集中趋势和离 散趋势。平均值是使用频率比较高的集中指标,它在一定 水平上反映了一组数据的集中程度。但是对于一些特殊 的问题,如在人口调查、服装设计、洪水研究、金融风险分 析方面的应用中,平均数无法提供足够多的信息来反映问 题。为此提出了分位数估计。
最常见的分位数便是中位数,除此之外还包括5%分 位数、25%分位数和95%分位数等。这些分位数都属于位 置坐标,具体体现在一些原始数据排序以后的某个百分位 数的具体数值。联合一组数据中的多个百分位数,可以更 好地了解数据所体现的某些规律。
1分位数估计方法
设随机变量X是连续的,它的累积分布函数为F(x),存在着唯一的概率密度函数为/〇c)。那么,对任何 一点p属于(〇,1),就把F(x)=p的;c称为此分布的分位数。根据目前的研究发现,估计分位数的方法基本分为两 大类:一类是参数估计,利用现有的数据信息来假定服从 的分布,然后用密度函数求出分位数;另一类是非参数估 计,不对总体分布做出具体假设,而是利用现有的信息进 行抽样,进而求出分位数,如Bootstrap分位数估计、核分位 数估计、K L分位数估计Jackknife分位数估计等方法。现 代条件下研究者对分位数进行非参数估计的研究逐渐成熟。Efron(1979)1"曾介绍了 Bootstrap重抽样的优点,特别 是在估计样本分位数方面,Bootstrap能利用自身的特点 来得到更好的结果,克服了以前
统计方法所遇到的一些 困难。所以本文采用非参数Bootstrap方法来估计分位数,并与正态分布假设下参数分位数估计方法做实证分析 和对比。
2 Bootstrap方法
Bootstrap应用领域很广,尤其是在工程与经济应用中 有不可忽视的作用。关于Bootstrap的研究成果,以Boot- strap为研究工具的文献不计其数。Brodin (2006)121利用对 样本次序统计量加权的方式来计算分位数时,采用Boot­strap 方法估计均方误差 M S E;Bennewitz 等 (2003 )131在估计 Q T L效应的偏差中比较了各种Bootstrap方法的优劣;而 Bin等(2012)1*1应用广义Bootstrap方法与传统的参数Boot­strap、非参数 Bootstrap 分别对高分位数进行估计,比较 广这三种方法的优劣。Takemoto等(2010)|5®f究了在临床前 实验中运用Bootstrap方法获得药物代谢动力学的最小样 本数;Basiri等(20丨7)161开发了一种针对Fast-I C A模型估 计量的相对简单且稳定的Bootstrap方法。国外的研究者 拓宽了 Bootstrap方法的应用领域,并把它应用在医学、数 学等方面并且取得了显著的成果。
国内学者也没有间断对Bootstrap的研究。袁修开等 (2012)171将以概率加权矩为约束条件的最大熵法和Boot­strap 方法结合 ,给出了小样本情况时估计分位数置信区间 的方法。谢佳利等(2008 )181则根据样本量的大小通过不同 方法来估计分位数,认为在样本量较小时选择使用Boot­strap 方法估计比较合适; 杨军和邹国华 (2007)191则采用比 例Bootstrap来处理缺失数据,通过插补的方法得到相对完
基金项目:国家社会科学基金资助项目(2019BTJ028);国家统计局科研一般项目(20181LY20)
作者简介:李莉莉(1975—),女,山东奉庄人,博士,教授,研究方向:统计调查与预测、经济统计。
张豉(1996—),女,山东聊城人,硕士研究生,研究方向:统计调查与预测、经济统计。
杜梅慧(1996—),女,山东临沂人,硕士研究生,研究方向:统计调查与预测、经济统计。
统计与决策2021年第10期•总第574期 15
整的数据集,并证明了用此方法来计算的方差的相合性。王丙参等(2015)11(11对 Bootstrap方法与 Bays Bootstrap方法 进行比较,认为Bays Bootstrap方法模拟稳定,估计标准差 比较小,但估计值并不一定好,甚至可能比Bootstrap方法差。
通过上文可以看出,把Bootstrap方法应用在分位数估 计中的研究很少,因此本文提出使用Bootstrap方法来估计 分位数。Bootstrap方法从样本中进行再抽样,不考虑总体 的具体分布,也属于非参数估计方法。Bootstrap抽样把样 本当成总体,计算出“参数”,再在样本中抽样,就可以算出 感兴趣的统计量。这种抽样方法的实现依据是子样本对 总体的估计效果和样本对总体的估计效果保持一致。Bootstrap方法是当代统计学领域里研究者普遍采用的一 种方法,它在小样本时表现出的优势更加明显。
Bootstrap抽样步骤为:(1)采取重复抽取方法从原始 样本中抽取一定数目的样本,该数目可以提前设定,在此 过程中所生成的样本可以相同。(2)根据子样本计算统计 量7'。(3)连续重复(1)和(2)过程\1次(一般\1>1000)。
(4)计算得到的M个统计量r的MSE等。
当样本量小时,利用Bootstrap方法对样本抽样,不但 在一定程度上可以获得r的经验分布函数,而且可以计 算出置信区间的范围。
3 Bootstrap抽样分位数估计
3.1 Bootstrap抽样步骤
使用Bootstrap抽样方法解决的最重要问
题是样本量不足。样本是用来估计总体的,当
样本量不足时,样本所估计出来的总体就可能
会有偏差,这时可以通过多次抽样来减少误
差,增加稳定性。
本文采用1988年全国人口调查中2000名
成年男子身体测量数据作为总体。Bootstrap分
位数估计实施步骤为:
第1步:进行简单随机抽样(S R S),本文选
择从2000个单位中抽取500个样本作为原始
样本。
第2步:进行再抽样,采取重复抽样方法从
500个样本中有放回地抽取某个数目的子样
本,此过程中生成的子样本可以相同。本文选
择分别抽取 20、30、40、50、60、70、80、90、100、
120、140、160、180、200、250、300 个子样本。
第3步:重复第2步1000次,得到1000个分位数。在 运用Bootstrap方法进行参数估计时遇到的问题之一就是 怎样选择抽取次数使结果最佳,即抽样次数的取值不能太 小,一般是次数越多越好。施锡铨和范正绮(1993广1实验 中取了 500次,Efron建议抽取1000〜2000次,本文选择抽 取1000次。
第4步:计算上述1000个分位数的样本均值、样本方
差等,获得统计量的相关信息,以评价估计精度和稳定性。
3.2抽取变量的选择
本文的数据来源于1988年全国人口调査成年男子身 体测量的各项指标,共有74个变量。既包括常见的身高、体重、坐高等变量,也有一些比较陌生的变量,如坐姿大转 子点高、坐姿枕外隆突点高等变量,其测量范围广泛。关于 变量的选取问题,本文计算出各个变量的方差并进行排序。
从排序后的结果可以看出,方差最小的变量为食指近 位指关节宽,是1.0184。方差最大的变量为中指指尖点上 举高,是7128.1679。选取的变量不但要概括这74个变量,而且数据的方差不能太小。所以根据方差排序的情况,选 取了手宽(方差为16.3192)、足长(方差为106.9872)、臀宽 (方差为239.7136)、肩宽(方差为332.5419)、坐深(方差为 480.5144)、坐高(方差为933.6723)、手功能高(
方差为 1317.5463)、肘高(方差为1871.4792)、胸上点高(方差为 2826.1824)、颏下点高(方差为3131.8043)、腰围(方差为 5808.1523)、中指指尖点上举高(方差为7128.1679)这12 个变量。
3.3 Bootstrap分位数估计结果分析
根据实施Bootstrap方法的步骤,抽取不同样本量的子 样本,并计算相关统计量。选择单个变量来进行分析,以坐高为例,其5%分位数的真实值是856。通过1000次的 Bootstrap抽样计算得到的关于5%分位数的最小值、最大 值、平均值、极差、方差、标准差、变异系数、置信区间、平均 绝对误差和平均相对误差的结果如表1所示。
从整体上来看,随着子样本量的增加,估计5%分位数 的平均值逐渐接近真实值,平均绝对误差和平均相对误差 逐渐减小,估计精度变高;估计分位数的标准差和变异系 数也逐渐减小,估计结果更加稳定。在子样本量较小的情 况下,如=20时,B o o tstrap抽样的估计值的平均相对误差 是0.0197,估计精度已经很理想,变异系数是0.0229,结果 也已经是比较稳定的。随着子样本量的增加,B o o tstrap分 位数估计在精度和稳定性上均有所提升,但变化不大。在
*1坐高5%分位数分析
子样本量最小值最大值平均值极差方差标准差变异
系数置信
下限
置信
上限
平均
绝对误差
平均
相对误差
20814891846.7677375.95019.3900.0229808.75884.7616.827
0.0197
30814884.5847.9270.5222.81014.9270.0176818.66877.1713.355
0.0156
40814880851.3966224.43014.9810.0176822.03880.7611.790
0.0138
50814881.5851.0667.5173.33013.1650.0155825.26876.8710.603
0.0124
60814881852.8467143.47011.9780.0141829.37876.328.900
0.0104
70817879853.2562113.36010.6470.0125832.39874.12
8.1800.0096
80820876853.965695.8279.7890.0115834.78873.157.386
0.0086
90817877.5853.8860.585.7239.2590.0108835.74872.03  6.970
0.0081
100820876854.025674.7208.6440.0101837.08870.97  6.490
0.0076
120820877854.745761.7027.8550.0092839.34870.13  5.9470.0070
140820873854.715354.2087.3630.0086840.28869.14  5.582
0.0065
160820876854.955640.157  6.3370.0074842.53867.37  5.042
0.0059
180820873855.505332.014  5.6580.0066844.41866.59  4.4870.0052
200827874855.494731.133  5.5800.0065844.55866.42  4.4040.0051
250833.5871.5855.363823.539  4.8520.0057845.85864.87  3.9140.0046
300835870855.353519.045  4.3640.0051846.80863.91  3.589
0.0042 16 统计与决策2021年第10期•总第574期
H探讨、子样本量《=300时,平均相对误差是0.0042,变异系数是
0.0051。结果表明,变量坐高的Bootstrap分位数估计的精
度很高,结果比较稳定,同时充分显示出Bootstrap分位数 估计在小样本量时的优势。
880-
860-
840-
820-
50100 '200 '30050100 ' 200 ' 30050100 ' 200 ' 300
(a)(b)(c)
图1坐高5%分位数的相关统计置
图1(a)表示坐高5%分位数的真实值和估计的平均值 的关系,可以直观地看出,随着子样本量的增加,平均值在 总体上是逐渐接近真实值的。但是平均值并不是随子样本量的增加呈线性接近的。当抽取的子样本量较小时,变 化趋势相对较大,但是随着子样本量的增加,子样本量在 100时,变化就逐渐趋于平稳。图1(b)描述了坐高5%分 位数的真实值和估计值的置信区间的关系,置信区间的宽 度随着子样本量的增加变得越来越小,同样在子样本量为 100时,宽度的变化减弱。Bootstrap方法对坐高5%分位数 的估计值,在精度和稳定性上都有较好表现,如图1(c)所示,平均相对误差和变异系数均取得较小值,且随着子样 本量的增加,估计效果更佳。852-
850-
848-
50 100 150 200 250 300 sb l6〇26〇2^0 3^0 50 100 150 200 250 300
(a)(b)(c)
• |纖0.020-• l-:i»
0.015-•
•••••o.oi a O•
.。•••
• • •
•.0.005-
-•
^:::i i;:
50 100 150 200 250 30(
(d)
50 100 150 200 250 30C
(e)
图2坐高三个分位数的相关统计置
本量。针对最佳子样本量这个问题,施锡铨和范正绮(1993)1111进行了数值模拟实验,认为估计中位数时,重抽 样样本量… = 〇.5*AT ( A?为原始样本容量)时,采用Boot­strap 抽样可以得到最佳估计量。就变量坐高而言, 如果从 平均值与真实值的关系图来看,估计5%分位数的最佳子 样本量为100,估计50%分位数时最佳子样本量为120,估 计95%分位数的最佳子样本量为90;如果从平均绝对误差 来看,估计5%、50%和95%分位数的最佳子样本量分别为 160、140、160。
下页图3U)至图3(c)分別表示中指指尖点上举高变
表2 坐高5%、50%和95%分位数分析
子样本量分位数最小值最大值平均值极差方差标准差变异系数置信下限置信上限
平均绝对
误差
平均相对
误差
真值5%814891846.7677375.95019.3900.0229808.75884.7616.8270.0197856
2050%879931904.185263.5267.9700.0088888.56919.81  6.5170.0072907 95%914996949.9982134.63011.6030.0122927.25972.7311.1370.0116958 5%835870855.353519.045  4.3640.0051846.80863.91  3.5890.0042856 30050%900912906.8312  3.318  1.8220.0020903.26910.40  1.4140.0016907 95%948968956.442010.096  3.1780.0033950.21962.67  2.8320.0030958从表2中的数据看出,在小于子样本量时,用Bootstrap
方法估计的坐高5%分位数、50%分位数和95%分位数的
平均相对误差和变异系数均取得较小值,在精度和稳定性
上都有较好表现。且随着子样本量的增大,估计三个分位
数的平均相对误差和变异系数都减小。但三者之间还是
有一定的差别。在相同子样本量的条件下,比较5%、50%
和95%分位数的估计结果可以看出,用Bootstrap方法估计
不同的分位数所得到的效果是不同的。中位数相对5%分
位数和95%分位数来说精度更高且更加稳定。
图2(a)至图2(c)分别表示坐高变量的5%、50%和
95%分位数的平均值与真实值的关系,图2(d)、图2(e)分
别表示三个分位数估计的变异系数和平均相对误差。对
变异系数和平均相对误差而言,可以明显看出,在相同子
样本量条件下,50%分位数估计效果最佳,95%分位数次
之,5%分位数估计效果相对最差。由图2还可知,随着子
样本量/!的增加,估计5%、50%和95%分位数的平均值均
逐渐接近真实值,精度和稳定性逐渐增强。即三个分位数
都可以通过增加子样本量提高估计效果。但Bootstrap抽
样并不是抽取的子样本量越多越好,而是有一个最佳子样量的5%、50%和95%分位数的平 均值与真
实值的关系,图3(d)、图3(e)分别表示三个分位数估 计的变异系数和平均相对误差。图2展现的三个分位数估计 的平均值都是小于真实值的,即 三个分位数都可以通过增加子样本量提高估计效果。通过对
12个变量分位数估计的数值模拟发现,并非所有变量的 估计结果都是如此。例如变量中指指尖点上举高的Boot­strap 估计 ,从图 3 可以 看出,其三个分位数估计的精度和 稳定性都是比较理想的。但在子样本量大于40后,50%和 95%分位数估计图3的平均值大于真实值,且随着子样本 量的增加,平均值逐渐偏离真实值,最终收敛到一个偏离 真实值的数值。Athreya(1987)"21曾证明了在总体方差无 限时,重抽样样本量等于原始样本量的Bootstrap方法会将 待估统计量收敛到一个随机极限。解决办法是将重抽样 的样本量取适当小即可。因此,对50%分位数而言,子样 本量为20时估计结果最佳;估计95%分位数时,子样本量 为40时估计结果最佳。这说明就中指指尖点上举高变量 来说,Bootstrap分位数估计效果在取较小子样本量时最为 理想。在74个变量中,中指指尖点上举高的方差最大,所 以变量的方差大小对Bootstrap抽样估计结果和选择的最 佳子样本量产生了重要影响。
统计与决策2021年第10期•总第574期 17
理论H
;
1995
1950
50 100 150 200 250 300 50 100 150 200 250 300 50 100 150 200 250 300
(a )
(b )
(c )
0.020
_
0.0I5_
0.01〇4 0.005 _
50
l6〇
1^0
200
250
300
(d ),5%分位数
> ■分位败,95%分位数
0.015—
0.0!0_
0.005_
SO 100 1^0 200 250 300
• 5%分位数〇
A  50%分位数
〇 95%分位数
〇〇〇
••〇〇〇〇 ▲
•參 〇〇
(e )
图3中指指尖点上举离三个分位数的相关统计置
4正态分布假设下分位数估计
正态分布假设下分位数估计属于参数估计,首先应对
数据进行正态性检验,当数据通过检验以后,再采用极大 似然估计方法来估计正态分布的均值与标准差;得到这两 个参数的具体估计数值以后,就可以知道其分布函数和概 率密度,进而求得分位数。在Matlab软件中,Jarque-Bera (J  B )检验、Kolmogorov-Smimov ( K S )检验和 L i l l i e f o r s  检验 都可以进行总体正态性检验。其中J B 检验适用于大样 本,当样本容量…较小时需慎用;K S 检验需要提前给定某 正态分布函数,所以一般仅用于标准正态性检验;L i l l i e f o r s  检验将K S 检验改进后用于一般的正态性检验。本文选择 使用Lilliefors检验,以坐高变量为例,将500个样本数据进 行正态性检验,正态概率图上的数据点基本落在同一条线 上,可以得出样本来自正态分布总体的结论(见图4)。
图4坐高正态概率图
用R 软件做出了坐高的直方图、核密度估计曲线和 正态分布概率密度曲线,两条曲线基本上是重合的,差别 不大(见图5)。样本经验分布函数和图也均证实该数 据来自正态分布总体。
坐高这组数据通过了正态性检验后,用极大似然估计 方法计算得出均值"=906.5660,标准差=30.7867。有了 正态分布的这两个参数,就能求其分布函数以及概率密度
图5坐高直方图、核密度估计曲线、正态分布概率密度曲线图
函数,进而求得分位数。使用R 软件进行实验分析,得到 5%、50%、95% 分位数分别是 855.926、906.566、957.206。 使用此方法得到的坐高分位数估计值和在子样本量分别 为20、140、300时的Bootstrap分位数估计结果如表3所示。
bootstrap项目表3
坐高的Bootstrap 抽样与正态分布假设对比
分位数
样本量估计结果
SRS / n  =500855Bootstrap  抽样/ /1 =20
846.765%分位数
Bootstrap  抽样/ w  =140854.71Bootstrap  抽样/ n  =300855.35正态分布假设下/n  =500
855.926真实值856SRS /«=500
907Boo  丨 s trap  抽样 / n  =20
904.1850%分位数
Bootstrap  抽样/ n  =140906.73Bootstrap  抽样/« =300906.83正态分布假设下/« =500
906.566真实值907SRS / n  =500957Bootstrap  抽样/ n  =20
949.9995%分位数
Bootstrap  抽样/ n  =140955.99Bootstrap  抽样/ n  =300956.44正态分布假设下/n  =500
957.206真实值
958
表3结果显示,在样本数据来自正态分布总体的假设 下,参数估计的坐高分位数的效果比Bootstrap估计分位数 的效果要稍好一些。在估计坐高5%分位数时,根据Boot­strap 方法在子样本量分别为 20、 140、300 时的估计值与真 实值的差值可以知道,通过增加子样本量能增加Bootstrap 抽样的精度。在估计50%分位数时,正态分布假设下分位 数是906.566, Bootstrap方法在n =140时估计值是906.73, 在子样本量低于300时估计效果就已经赶超了前者。此时 Bootstrap估计分位数的精度优于正态分布假设下的估计。
对所有的变量进行正态性检验,并采用极大似然估计 方法计算出各变量的均值与标准差,得到其分布函数以及 概率密度函数,进而在正态分布假设下采用参数分位数估计
方法来估计各个变量的分位数。并与子样本量为300时的
Bootstrap分位数估计的结果进行对比,如下页表4所示。
从表4可以看出,本文选取的12个变量中只有手宽、 腰围没有通过正态性检验,其余变量都通过了检验。对手 宽变量而言,其总体数据方差较小,Bootstrap估计方法和 正态分布假设下参数估计方法的分位数估计结果精度都 非常高。同时,在变量通过正态检验的条件下,正态假设 下的估计效果并不总是最优的。如颏下点高和中指指尖 点上举高的5%分位数、95%分位数,肩宽的5%分位数、
18
统计与决策2021年第10期•总第574期
表4各变置Bootstrap与正态分布假设下的分位数估计对比
变量是否通过
正态检验
5%分位数50%分位数
正态
假设
Bootstrap真实值
正态
假设
Bootstrap真实值
臂宽是281.007280.27282305.372304.56306肩宽是344.087343.32343374.452373.79374颏下点高是1362.121362.413641454.41455.81455手功能高是681.926681.52682744.466745.28741手宽否75.603175.0957582.19882.58582胸上点高是1278.91275.212791366.051368.81369腰围否628.275647.66647750.776737.42735中指指尖点
上举高
是1968.861960.919642113.322117.82112肘髙是954.938952.469531024.641024.91024足长是229.298229.87230245.944245.71247坐高是855.926855.35856906.566906.83907坐深是421.311418.07420457.094456.8458
95%分位数
正态
假设
Bootstrap
329.737
404.817
1546.68
807.007
88.7929
1453.21
873.277
2257.78
1094.35
262.59
957.206
492.878
330.1
405.17
1544.3
804.15
88.739
1448.1
885.84
2253.8
1093.6
263.07
956.44
492.62
332
404
1544
801
89
1454
894
2243
1094
264
958
493
50%分位数的估计中,Bootstrap方法结果较好。纵向来 看,在5%、95%分位数估计中,Bootstrap方法分位数估计 偏差比正态假设下分位数估计偏差小的变量有6个,即两 种方法估计精度不分上下。在50%分位数中,Bootstrap方 法分位数估计偏差比正态假设下分位数估计偏差小的变 量有4个,分别为肩宽、胸上点高、腰围和坐高,正态分布 假设下,估计50%分位数时的优势稍突出。
综合来讲,在变量通过正态性检验后,采用Bootstrap 非参数估计方法和采用正态分布假设下的参数估计方法 估计分位数的结果都具有较高精度;若变量没有通过正态 性检验,采用Bootstrap非参数估计方法估计分位数的效果 较好。
5结束语
本文通过数值分析,得到了 Bootstrap抽样方法对分位 数的估计效果。并且与正态分布假设下的参数估计方法 进行了比较。
Bootstrap分位数估计属于非参数估计方法之一。因为不对总体做出具体假设,不受总体分布的影响,而是利 用现有的信息来进行估计,因此其应用比较灵活多变,使 用该方法能取得较高的精度和稳定性。Bootstrap抽样方 法可以通过增加抽取的子样本量和抽样次数来提高估计
对于样本来自正态分布总体的情况而真实值_,采用Bootstrap方法和在正态分布假设下的
参数估计方法对分位数的估计效果大致相
同。但在选择正态分布假设下的分位数估计
方法时,应先进行正态性检验。因此,在进行
分位数估计时,采用Bootstrap方法为较好的选
择。
参考文献:
[1] Efron B. Bootstrap Methods: Another L x)〇k at Jack­
knife [J].The Annals of Statistics,1979,7(1).
[2] Brodin E.On Quantile Estimation by Bootstrap [J].Com­
putational Statistics & Data Analysis,2006,(50).
[3] Bennewitz J, Reinsch N, Kalm E.Comparison of Sever­
al Bootstrap Methods for Bias Reduction of QTL Effect Estimates [J].
Journal of Animal Breeding & Genetics,2003,(6).
[4] Bin W, Satya N M, Madhuri S M, et al.Comparison of Bootstrap and
Generalized Bootstrap Methods for Estimating High Quantiles [J].
Journal of Statistical Planning and Inference,2012,(10).
[5] T akemoto S, Yamaoka K, Nishikawa M, et al.Bootstrap Method-based
Estimation of the Minimum Sample Number for Obtaining Pharmaco­
kinetic Parameters in Preclinical Experiments [J].Joumal of Pharma­
ceutical Sciences,2010,(4).
[6] Basiri S, Ollila E, Koivunen V. Enhanced Bootstrap Method for Statis­
tical Inference in the ICA Model [JJ.Signal Processing,2017,(138).
[7] 袁修开,吕震宙,岳珠峰.小样本下分位数函数的Bootstrap置信区间
估计[J]•航空学报,2012,33( 10).
[8] 谢佳利,杨善朝,梁鑫.VaR样本分位数估计的偏差改进[J].数量经
济技术经济研究,2008,25(12).
[9] 杨军,部国华.比例Bootstrap及其方差估计的相合性[J].中国科学院
研究生院学报,2007,(3).
[10] 王丙参,魏艳华,戴宁.Bootstrap方法与Bays Bootstrap方法的比
较[J].统计与决策,2015,(20).
[11] 施锡铨,范正绮.抽样调查中分位数估计及误差[J].统计研究,1993,
(5)
[12] Athreya K B.Bootstrap of the Mean in the Infinite Variance Case [J].
Annals of Statistics, 1987,15(2).
(责任编辑/易永生)
效果,但是需要有一个最佳子样本量。
Q uantile E stim ation Based on B ootstrap M ethod
Li L i l i,Zhang Xuan,Du Meihui
(School of Economics,Qingdao University,Qingdao Shandong 266071, China)
Abstract: Quantile i s widely used in census,clothing design,flood research and financial r i s k analysis.Quantile estimation methods are basically divided in t o two categories:one i s parametric estimation, and the other i s non-parametric estimation. This paper employs non-parametric Bootstra
p quantile estimation t o study anthropometric indexes and compares i t with parametric quantile estimation.The results show that using Bootstrap sampling method has more accurate and stable result of quantile estima­tion.
Key words: Bootstrap sampling;quantile estimation;non-parametric estimation
统计与决策2021年第10期•总第574期 19