不完全数据下半参数回归模型的统计推断
在生存分析、医药追踪试验、可靠性与寿命试验等许多实际问题中,经常遇到不完全数据.不完全数据给数据的使用和分析带来了很大困难,也是造成信息系统不确定的主要原因之一.如何有效的利用这些不完全数据信息进行统计推断具有重要的实际意义.非参数回归模型在完全数据下的统计性质已经发展得较为完善,而在不完全数据下的统计分析还是一个历史不长、有待进一步发展的领域.本文是在不完全数据下,研究半参数回归模型的统计推断问题.主要有以下四个方面的研究工作:第二章,主要研究缺失数据下带不等式约束的反应变量均值的假设检验.当反应变量是随机缺失时,我们利用纠偏加权的方法进行插值,构造反应变量均值的带不等式约束条件的纠偏的经验对数似然比检验统计量,在一定的条件下,获得了检验统计量的渐近分布,这些结果可用来构造拒绝域.结果表明,有辅助信息的检验统计量比没有使用辅助信息的检验统计量更加有效.模拟研究用来评估所提方法在有限样本下的表现.第三章,考虑缺失数据下的部分线性测量误差模型的非参数检验问题为了克服测量误差带来的偏倚,借助二次条件矩方法,我们提出了两个纠偏的检验统计量,获得了检验统计量的极限零分布以及检验的p值.通过比较p值,我们发现提出的两个检验统计量有类似的理论性质.同时,我们提出的检验可以以局部光滑方法中的最优速度识别出备择假设.最后通过模拟研究来演示提出的检验方法的表现,并
将提出的方法应用到ACTG 175数据研究中.第四章,在反应变量是随机左截断数据下,研究部分线性分位数回归模型的估计和变量选择问题.首先,基于截断变量分布函数的乘积限估计所确定的权重,我们对模型中的参数和非参数部分提出了一个三阶段估计过程.结果表明:第二阶段和第三阶段所得到的估计量比第一阶段的初始估计量更有效.其次,为了获得回归参数的稀疏估计,我们结合SCAD惩罚方法给出了部分线性分位数回归模型的变量选择过程.模拟研究用来评估提出的估计量及变量选择方法在有限样本下的表现第五章,在随机截断数据下,我们研究了变系数模型的分位数估计和检验.首先,为了处理截断数据,我们引入了随机权并构造了非参数函数的加权分位数估计量,获得了加权分位数估计量的渐近性质.其次,为了改进估计的有效性,我们进一步提出了非参数函数的加权复合分位数估计量,建立了加权复合分位数估计量的渐近性质.然后,为了检验变系数分位数回归模型中的非参数函数是否是某一个具体的函数形式,我们提出了一个新的基于Bootstrap的检验方法最后通过模拟研究和实例来验证文中提出的估计和检验方法。