SPSS超详细操作:分层回归(hierarchical multiple regression)
1、问题与数据
最大携氧能力(maximal aerobic capacity, VO2max)是评价人体健康的关键指标,但因测量方法复杂,不易实现。某研究者拟通过一些方便、易得的指标建立受试者最大携氧能力的预测模型。
目前,该研究者已知受试者的年龄和性别与最大携氧能力有关,但这种关联强度并不足以进行回归模型的预测。因此,该研究者拟逐个增加体重(第3个变量)和心率(第4个变量)两个变量,并判断是否可以增强模型的预测能力。
本研究中,研究者共招募100位受试者,分别测量他们的最大携氧能力(VO2max),并收集年龄(age)、性别(gender)、体重(weight)和心率(heart_rate)变量信息,部分数据如下:
注:心率(heart_rate)测量的是受试者进行20分钟低强度步行后的心率。
2、对问题的分析
研究者拟判断逐个增加自变量(weight和heart_rate)后对因变量(VO2max)预测模型的改变。针对这种情况,我们可以使用分层回归分析(hierarchical multiple regression),但需要先满足以下8项假设:假设1:因变量是连续变量
假设2:自变量不少于2个(连续变量或分类变量都可以)
假设3:具有相互独立的观测值
假设4:自变量和因变量之间存在线性关系
假设5:等方差性
假设6:不存在多重共线性
假设7:不存在显著的异常值
假设8:残差近似正态分布
那么,进行分层回归分析时,如何考虑和处理这8项假设呢?
3、对假设的判断
3.1 假设1-2
假设1和假设2分别要求因变量是连续变量、自变量不少于2个。这与研究设计有关,需根据实际情况判断。
3.2 假设3-8
为了检验假设3-8,我们需要在SPSS中运行分层回归,并对结果进行一一分析。
(1)点击Analyze→Regression→Linear
出现下图:
(2)将因变量(VO2max)放入Dependent栏,再将自变量(age和gender)放入Independent栏:
解释:因研究者已知性别、年龄与最大携氧能力的关系,我们先把这两个变量放入模型。
(3)点击Next,弹出下图:
解释:大家可能会注意到Independent(s)框中的标签由-Block 1 of 1- 变为-Block 2 of 2-。这说明age和gender变量依旧存在于模型中,在- Block 2 of 2-中,大家可以点击Previous查看。同时,Method栏应设置为“Enter”,一般是SPSS自动设置的;如果不是,也应人工设置为“Enter”。
(4) 将自变量(weight)放入Independent栏
解释:放入weight变量是为了检验加入该变量后对age、gender-VO2max预测模型的影响。
(5)点击Next,弹出下图:
解释:大家可能会注意到Independent(s)框中的标签由-Block 2 of 2- 变为-Block 3 of 3-。同样地,age、gender和weight变量依旧存在于模型中,可以点击Previous查看。Method栏也应设置为“Enter”,如果不是,改为“Enter”。
(6)将自变量(heart_rate)放入Independent栏
解释:放入heart_rate变量是为了检验加入该变量后对age、gender、weight-VO2max预测模型的影响。
(7)点击Statistics,弹出下图:
(8)在Regression Coefficient框内点选Confidence intervals,在Residuals框内点选Durbin-Watson和Casewise diagnosis,并在主对话框内点选R squared change、Descriptives、Part and partial correlations和Collinearity diagnosis
(9) 点击Continue,回到主界面。
weight的所有形式(10)点击Plots,弹出下图:
(11)在Standardized Residual Plots对话框中点选Histogram和Normal probability,并点选Produce all partial plots
(12)点击Continue回到主对话框
(13) 点击Save
(14)在Predicted Values框内点选Unstandardized,在Distances框内点选Cook’s和Leverage values,在Residuals框内点选Studentized和Studentized deleted