耶茨校正计算器

创建者: Neo

审核人: Ming

最后更新: 2025-06-10 14:11:06

总计算次数: 794

标签:

理解耶茨校正对于在使用小样本量或离散分布时进行准确的卡方检验至关重要。本指南提供了对该概念、其应用以及实际示例的全面解释，以帮助您实现精确的统计分析。

耶茨校正的重要性：提高小样本的统计准确性

基本背景

卡方检验被广泛用于确定两个分类变量之间是否存在显着关联。然而，这些检验假定大样本量，当应用于较小的数据集时，这可能会导致对显着性的高估。耶茨校正通过调整卡方值以实现连续性来解决此问题。

主要优点：

减少小样本卡方检验中的偏差
提高数据点有限的列联表中的准确性
防止关于关联的误导性结论

此校正对于样本量小于 20 的 2×2 列联表特别有用。

准确的耶茨校正公式：获得可靠的统计结果

耶茨校正的公式如下：

\[ YC = \frac{(|O_1 - E_1| - 0.5)^2}{E_1} + \frac{(|O_2 - E_2| - 0.5)^2}{E_2} \]

其中：

\( O_1 \) 和 \( O_2 \) 是单元格 1 和 2 的观察频率
\( E_1 \) 和 \( E_2 \) 是单元格 1 和 2 的预期频率

应用公式的步骤：

计算观察频率和预期频率之间的绝对差。
从每个绝对差中减去 0.5 以调整连续性。
对调整后的值进行平方。
将每个平方值除以相应的预期频率。
将结果相加即可获得耶茨校正。

实际计算示例：掌握耶茨校正

示例 1：医学研究数据

场景： 您正在分析一项研究，该研究使用 2×2 列联表比较两组之间的治疗成功率。

组	成功	失败
A	10	8
B	12	14

观察到的频率：\( O_1 = 10 \)，\( O_2 = 12 \)
预期频率：\( E_1 = 8 \)，\( E_2 = 14 \)
计算绝对差：\( |10 - 8| = 2 \)，\( |12 - 14| = 2 \)
调整连续性：\( 2 - 0.5 = 1.5 \)，\( 2 - 0.5 = 1.5 \)
对结果进行平方：\( 1.5^2 = 2.25 \)，\( 1.5^2 = 2.25 \)
除以预期频率：\( \frac{2.25}{8} = 0.28125 \)，\( \frac{2.25}{14} = 0.16071 \)
将结果相加：\( YC = 0.28125 + 0.16071 = 0.44196 \)

结论： 耶茨校正提高了此数据集卡方检验的可靠性。

关于耶茨校正的常见问题解答：澄清常见疑问

Q1：我应该在什么时候使用耶茨校正？

在以下情况下使用耶茨校正：

您的数据集涉及 2×2 列联表
样本量很小（通常小于 20）
连续数据近似值可能会引入偏差

*专家提示：* 始终评估您的样本量是否证明需要进行校正。

Q2：耶茨校正是否适用于所有卡方检验？

不，它仅适用于 2×2 列联表。对于较大的表，其他校正（如 Fisher 精确检验）可能更合适。

Q3：为什么在计算中减去 0.5？

减去 0.5 可调整卡方检验假定连续数据而实际观察结果是离散的事实。这种调整确保了理论分布和观察分布之间更好的对齐。

统计术语词汇表

理解这些关键术语将增强您对耶茨校正的掌握：

卡方检验： 一种统计检验，用于确定两个分类变量之间是否存在显着关联。

列联表： 一个表，显示一个变量在行中，另一个变量在列中的分布，通常用于卡方检验中。

观察频率： 给定类别中发生的实际计数。

预期频率： 在没有关联的假设下，由零假设预测的计数。

连续性校正： 一种统计调整，用于解释离散分布和连续分布之间的差异。

关于耶茨校正的有趣事实

历史背景： 这种校正由弗兰克·耶茨在 20 世纪初开发，旨在解决皮尔逊卡方检验应用于小数据集时的局限性。
现代相关性： 虽然现代计算方法减少了对耶茨校正的依赖，但它仍然是确保特定场景中准确性的宝贵工具。
统计学家之间的争论： 一些统计学家反对耶茨校正，因为它在某些情况下可能存在校正不足的情况。然而，它仍然被广泛教授和应用于教育目的和实际应用。

计算过程: