1.估计样本量的决定因素
1.1资料性质
计量资料如果设计均衡,误差控制得好,样本可以小于30例;计数资料即使误差控制严格,设计均衡,样本需要大一些,需要30-100例。
1.2研究事件的发生率
研究事件预期结局出现的结局(疾病或死亡),疾病发生率越高,所需的样本量越小,反之就要越大。
1.3研究因素的有效率
有效率越高,即实验组和对照组比较数值差异越大,样本量就可以越小,小样本就可以达到统计学的显着性,反之就要越大。
1.4显着性水平
即假设检验第一类(α)错误出现的概率。为假阳性错误出现的概率。α越小,所需的样本量越大,反之就要越小。α水平由研究者具情决定,通常α取0.05或0.01。
1.5检验效能
检验效能又称把握度,为1-β,即假设检验第二类错误出现的概率,为假阴性错误出现的概率。即在特定的α水准下,若总体参数之间确实存在着差别,此时该次实验能发现此差别的概率。检验效能即避免假阴性的能力,β越小,检验效能越高,所需的样本量越大,反之就要越小。β水平由研究者具情决定,通常取β为0.2,0.1或0.05。即1-β=0.8,0.1或0.95,也就是说把握度为80%,90%或95%。
1.6容许的误差(δ)
如果调查均数时,则先确定样本的均数()和总体均数(m)之间最大的误差为多少。容许误差越小,需要样本量越大。一般取总体均数(1-α)可信限的一半。
1.7总体标准差(s)
一般因未知而用样本标准差s代替。
1.8双侧检验与单侧检验
采用统计学检验时,当研究结果高于和低于效应指标的界限均有意义时,应该选择双侧检验,所需样本量就大;当研究结果仅高于或低于效应指标的界限有意义时,应该选择单侧检验,所需样本量就小。当进行双侧检验或单侧检验时,其α或β的Ua?界值通过查标准正态分布的分位数表即可得到。
2.样本量的估算
由于对变量或资料采用的检验方法不同,具体设计方案的样本量计算方法各异,只有通过查阅资料,借鉴他人的经验或进行预实验确定估计样本量决定因素的参数,便可进行估算。
护理中的量性研究可以分为3种类型:①描述性研究:如横断面调查,目的是描述疾病的分布情况或现况调查;②分析性研究:其目的是分析比较发病的相关因素或影响因素;③实验性研究:即队列研究或干预实验。研究的类型不同,则样本量也有所不同。
2.1描述性研究
护理研究中的描述性研究多为横断面研究,横断面研究的抽样方法主要包括单纯随机抽样、系统抽样、分层抽样和整抽样。分层抽样的样本量大小取决于作者选用的对象是用均数还是率进行抽样调查。
例.要做一项有关北京城区护士参与继续教育的学习动机和学习障碍的现状调查,采用分层多级抽样,选用的是均数抽样的公式,Uα为检验水准α对应的υ值,σ为总体标准差,δ为容许误差,根据预实验得出标准差σ=1.09,取α=0.05,δ=0.1,样本量算得520例,考虑到10%-15%的失访率和抽样误差,样本扩展到690例。
2.2分析性研究
2.2.1探索有关变量的影响因素研究
有关变量影响因素研究的样本量大多是根据统计学变量分析的要求,样本数至少是变量数的5-10倍。例如,如果研究患者生存质量及影响因素,首先要考虑影响因素有几个,然后通过文献回顾,可知约有12个预测影响变量,如年龄、性别、婚姻、文化程度、家庭月收入、医疗付费方式、病程、排菌、喀血、结核中毒症状、心理健康、社会支持,那么研究的变量就可以在60-120例。这是一种较为简便的估算样本量的方法,在获得相关文献支持下,最好根据公式计算,计量资料的样本量估算可用公式,根据预实验中的数据(也可以依据其他文献的结果)得出标准差S和容许误差δ,代入公式最终计算出样本量,计数资料资料可用公式,P为样本率。
2.2.2研究某变量对另一变量的影响
对于研究某变量对另一变量的影响来说,样本量可以根据直线相关的公式获得,μα与μβ与分别为检验水准α和第Ⅱ类错误的概率β相对应的U值,ρ为总体相关系数。
例.要做一项血透患者自我管理水平对其健康状况影响的研究,
假设α=0.05,power=0.80,
查表得μα=1.96,μβ=0.84,总体相关系数可选用文献报道中血液透析患者自我管理水平与健康调查简表得分相关系数为0.274,代入公式就可算出所需样本量为103例。
2.2.3两变量或多变量的相关研究
对于两变量或多变量相关的研究,样本量与自变量的多少有关,一般是其10倍,也可以采用公式计算。Uα为检验水准α相对应的U值,S为标准差,δ为容许误差。
例.研究慢性腰背痛患者认知-情感应对、自我和谐与适应水平的关系.
设定显着性水平α=0.05,则Uα=1.96,标准差和容许误差可从预实验中获得,根据预实验的S和δ值,算出S/δ=5,样本量则为99例.
2.3实验性研究
实验性研究样本量的估算公式,也分计量资料和计数资料两种。计量资料可采用两样本均数的计算公式N1=N2=,计数资料可采用率的计算公式。式中N1、N2分别为两样本含量,一般要求相等,S为两总体标准差的估计值,一般假设其相等或取合并方差的平方根,δ为两均数之差值(若为自身对照,δ也可以写为d),tα?/2和tβ?/2分别为检验水准α和第Ⅱ类错误概率β相对应的t值。α有单双侧之分,而β只取单侧。
例.一项心肌梗死患者院外自助式心脏康复的效果研究,可以采用此公式计算,其中的d可以选取文献中报道的、自助式康复手册的随机对照研究中的干预组和对照组在普通健康问卷GHQ的得分:d=10.7-5.3=5.4,计算Sc为8.78,双侧α=0.05,β=0.1,查表得tα?/2=1.96,tβ=1.282,代入公式得出两组各需样本为56例。
附临床研究样本量的估计:
1.计量资料
1.1对总体平均数m做估计调查的样本估计
公式:
式中:n为所需样本大小;Ua为双侧检验中,a时U的界值,当a=0.05时,U0.05?=1.96,a=0.01时,U0.01?=2.58;s为总体标准差;δ为容许的误差。例1:某学校有学生3500人,用单纯随机抽样调查学生的白细胞水平,根据预查标准差为950个/mm,允许误差不超过100个/mm,应调查多少人?
N=3500d=100个/mms=950个/mm
a=0.05(双侧)Ua=1.96
n=(1.96×950/100)≈347
1.2对样本均数与总体均数的差别做显着性检验时,所需样本的估计。
单侧检验用:单侧检验用:n=[(U2?α?+U2?β?)s/δ](式1.2-1)
双侧检验用:n=[(Uα?+U2?β?)s/δ](式1.2-2)
式中:α与β分别为第一类错误及第二类错误出现的概率,Uα、?U2?α、?U2?β??分别为α、2α、2β检验水准的t值。
2计数资料
2.1对总体率π?做估计调查的样本大小
公式:n=(Uα?/δ)/P(1-P)(式2.1)
式中:δ为容许的误差:即允许样本率(p)和总体率(P)的最大容许误差为多少。P为样本率。
例2:对某地HBsAg阳性率进行调查,希望所得的样本率(p)和总体率(P)之差不超过2%,基于小规模预调查样本率P=14%,应调查多少人?(规定a=0.05)
已知:δ=0.02,P=0.14,a=0.05,Ua=1.96
n=(1.96/0.02)2/?×0.14(1-0.14)=1156
需调查约1160人.
2.2对样本率与总体率的差别做显着性检验时,所需样本的估计。
单侧检验用:n=(U2?α?+U2?β?/δ2?)(式2.2-1)
双侧检验用:n=(Uα?+U2?β?/δ)(式2.2-2)
式中:α与β分别为第一类错误及第二类错误出现的概率,Uα、?U2?α、?U2?β??分别为α、2α、2β检验水准的t值。
2.3对样本均数与总体均数的差别做显着性检验时,所需样本的估计。
单侧检验用:n=[(U2?α?+U2?β?)s/δ]P(1-P)式2.3-1)
双侧检验用:n=[(Uα?+U2?β?)s/δ]P(1-P)(2.3-2)
式中:α与β分别为第一类错误及第二类错误出现的概率,Uα、?U2?α、?U2?β??分别为α、2α、2β检验水准的U值。odds
3病例对照研究的样本量估计
选择患有特定疾病的人作为病例组,和未患这种疾病的人作为对照组,调查两组人过去暴露于某种(些)可能危险因素的比例,判断暴露危险因素是否与疾病有关联及其关联程度大小的一种观察性研究。
3.1设置估算样本量的相关值
①人中研究因素的暴露率(对照组在目标人中估计的暴露率);
②比值比(oddsratio,OR)估计出的各研究因素的相对危险度或暴露的比值比(即RR或OR)
③α值,检验的显着性水平,通常取α=0.01或0.05;
④期望的把握度(1-β),通常区β=0.10或0.20;即把握度为90%或80%。
根据以上有关参数查表或代公式计算
公式为:
n=(U+U)/(p1?-p0?)2(式3.1)
p1?=p0?×OR/1-p0?+OR×P0
=1/2(p1?+p0?)=1-q1?=1-p1?q0?=1-p0
p0与P1分别为对照组及病例组人估计的暴露率;
OR为主要暴露因子的相对危险度或暴露的比值比(RR或OR)。
q0?=1-P0?,q1?=1-P1?;
为两组暴露史比例的平均值,
既=(P1?+P2?)/2,Q1?=1-P1?;