回归样本量计算器

创建者: Neo

审核人: Ming

最后更新: 2025-06-09 17:32:16

总计算次数: 1073

标签:

理解如何确定回归分析所需的样本量对于确保你的研究具有足够的统计功效来检测变量之间有意义的关系至关重要。这份综合指南探讨了计算样本量背后的科学原理，提供了实用的公式和专家建议。

为什么样本量在回归分析中很重要

基本背景

在回归分析中，样本量在决定结果的可靠性和有效性方面起着关键作用。一个周密计划的样本量可以确保：

统计功效：当真实存在效应时，检测到显著效应的能力
精确性：估计值周围更小的置信区间
资源优化：避免不必要的数据收集成本

所需的样本量取决于几个因素：

效应量 (f²)：衡量变量之间关系的强度
显著性水平 (α)：当零假设为真时，拒绝零假设的概率（通常设置为 0.05）
功效 (1 - β)：当零假设为假时，正确拒绝零假设的概率（通常设置为 0.8 或更高）
预测变量的数量 (k)：表示模型的复杂性

准确的样本量公式：通过精确的计算确保可靠的结果

计算回归分析所需的样本量的公式为：

\[ N = \frac{(Z_{\alpha/2}^2 + Z_\beta^2)}{f^2} + k + 1 \]

其中：

\( N \) 是所需的样本量
\( Z_{\alpha/2} \) 是标准正态分布中对应于所需显著性水平的临界值
\( Z_\beta \) 是标准正态分布中对应于所需功效的临界值
\( f^2 \) 是效应量
\( k \) 是回归模型中预测变量的数量

Z 值示例：

对于 α = 0.05（双尾检验），\( Z_{\alpha/2} = 1.96 \)
对于功效 = 0.8，\( Z_\beta = 0.84 \)

实际计算示例：优化您的研究设计

示例 1：小效应量

场景： 您正在进行一项研究，该研究具有小效应量（\( f^2 = 0.02 \)）、0.05 的显著性水平、0.8 的功效和 3 个预测变量。

确定 \( Z_{\alpha/2} \) 和 \( Z_\beta \)：
- \( Z_{\alpha/2} = 1.96 \)
- \( Z_\beta = 0.84 \)
将值代入公式： \[ N = \frac{(1.96^2 + 0.84^2)}{0.02} + 3 + 1 = \frac{4.84}{0.02} + 4 = 242 + 4 = 246 \]
结果： 您至少需要 246 名参与者的样本量。

示例 2：中等效应量

场景： 您正在进行一项研究，该研究具有中等效应量（\( f^2 = 0.15 \)）、0.05 的显著性水平、0.8 的功效和 5 个预测变量。

确定 \( Z_{\alpha/2} \) 和 \( Z_\beta \)：
- \( Z_{\alpha/2} = 1.96 \)
- \( Z_\beta = 0.84 \)
将值代入公式： \[ N = \frac{(1.96^2 + 0.84^2)}{0.15} + 5 + 1 = \frac{4.84}{0.15} + 6 = 32.27 + 6 = 38.27 \]
结果： 您至少需要 39 名参与者的样本量。

回归样本量常见问题解答：专家解答以加强您的研究设计

问题 1：如果样本量太小会发生什么？

小样本量会增加 II 类错误（未能检测到真实效应）的风险，并降低估计的精确性。这可能导致不可靠的结果并浪费资源。

问题 2：我可以将此计算器用于多元回归模型吗？

是的！此计算器适用于任何回归模型，只要您指定预测变量的数量、效应量、显著性水平和功效即可。

问题 3：我该如何解释效应量？

效应量量化了变量之间关系的强度。常见的基准是：

小：\( f^2 = 0.02 \)
中等：\( f^2 = 0.15 \)
大：\( f^2 = 0.35 \)

回归术语表

理解这些关键术语将帮助您掌握回归分析：

效应量 (f²)： 回归模型中变量之间关系强度的度量。

显著性水平 (α)： 统计显著性的阈值，通常设置为 0.05。

功效 (1 - β)： 如果存在效应，检测到效应的概率，通常设置为 0.8 或更高。

预测变量的数量 (k)： 回归模型中包含的自变量总数。

关于回归分析的有趣事实

科恩指南： Jacob Cohen 引入了标准化的效应量指南，从而更容易解释跨研究的回归结果。
多重共线性影响： 预测变量之间的高度相关性会抬高标准误差并减少可靠估计所需的有效样本量。
现实世界的应用： 回归分析广泛应用于经济学、医疗保健和社会科学等领域，以预测结果并为决策提供信息。