样本量计算是统计学中的一个概念,主要用于确定在给定的置信水平和误差范围内进行研究所需的最小样本数。
对于一个无限总体的情况,样本量计算公式可以简化表示为:
n = (Z^2 * p * (1-p)) / E^2
如果我们需要校正有限总体的大小,样本量的计算公式则变为:
n = (N * Z^2 * p * (1-p)) / ((N-1) * E^2 + Z^2 * p * (1-p))
在这里:
n 是所需样本量。
Z 是与所选置信水平相对应的Z值。
p 是事件发生的概率。
E 是可接受的误差范围(以百分比表示)。
N 是总体的大小。
举个例子,如果我们希望在95%的置信水平下,以5%的边际误差来确定事件发生的概率,且事件发生的概率预估为50%,总体大小为10000,我们可以将这些值代入上述有限总体的公式中计算。
使用Z=1.96(95%置信水平对应的Z值),p=0.5,E=0.05,N=10000,计算过程如下:
n = (10000 * 1.96^2 * 0.5 * (1-0.5)) / ((10000-1) * 0.05^2 + 1.96^2 * 0.5 * (1-0.5))
n = (10000 * 3.8416 * 0.25) / (9999 * 0.0025 + 0.9604)
n = (38416 * 0.25) / (24.9975 + 0.9604)
n = 9604 / 25.9579
n ≈ 370
所以,在这个例子中,您需要大约370名参与者的样本,以便以95%的置信度和5%的边际误差来估计某一事件的发生概率。