欢迎加入官方 QQ 用户交流群,群号: 960855308

有任何问题或者新的计算器添加都可以提出,我们负责免费修正和实现提高你的工作效率。

使用公式 X² = (B - C)² / (B + C),计算得到的卡方值为 {{ chiSquared.toFixed(4) }}。

计算过程:

1. 将 B 和 C 的值代入公式:

X² = ({{ b }} - {{ c }})² / ({{ b }} + {{ c }})

2. 进行减法和加法运算:

({{ b - c }})² / ({{ b + c }})

3. 计算差的平方:

{{ (b - c) ** 2 }}

4. 除以和:

{{ (b - c) ** 2 / (b + c) }}

分享
嵌入

麦克内马尔检验计算器

创建者: Neo
审核人: Ming
最后更新: 2025-06-10 03:39:43
总计算次数: 856
标签:

McNemar 检验是一个强大的统计工具,用于评估配对分类数据的差异。无论您是分析医疗治疗的有效性、评估调查回复的变化,还是比较诊断测试,本指南都将提供您充满信心地执行 McNemar 检验所需的一切。


理解 McNemar 检验:为什么它对您的研究至关重要

基本背景

McNemar 检验专为配对的定类数据设计,其中相同的主体被测量两次——通常是在干预前后或在两种不同的条件下。它评估两组相关组之间的结果比例是否存在显著差异。

主要应用包括:

  • 医学研究:比较对同一患者的诊断准确性或治疗效果。
  • 心理学:评估行为或态度随时间的变化。
  • 社会科学:分析公众舆论或政策影响的转变。

McNemar 检验使用 2×2 列联表来总结观察到的结果之间的差异。卡方统计量量化这些差异,使研究人员能够确定统计显著性。


公式分解:简化复杂计算

McNemar 检验公式很简单:

\[ X^2 = \frac{(B - C)^2}{B + C} \]

其中:

  • \(B\) 和 \(C\) 代表列联表中的不一致配对:
    • \(B\):从“否”变为“是”的主体。
    • \(C\):从“是”变为“否”的主体。

该公式比较了一个方向与另一个方向的变化频率,有助于识别有意义的趋势。

自由度: McNemar 检验具有 1 个自由度,因为它评估配对变量之间的单一关系。


实践示例:应用 McNemar 检验

场景

一项研究调查了一种新的教学方法是否能提高学生对统计学的理解。研究人员对 100 名学生进行前测和后测,记录他们的通过/失败结果。

后测通过 后测失败
前测通过 40 10
前测失败 20 30

这里:

  • \(B = 20\)(最初失败但后来通过的学生)
  • \(C = 10\)(最初通过但后来失败的学生)

步骤

  1. 将值代入公式: \[ X^2 = \frac{(20 - 10)^2}{20 + 10} = \frac{100}{30} = 3.33 \]
  2. 将 \(X^2\) 与卡方分布的临界值进行比较(\(\alpha = 0.05\),df = 1):
    • 临界值 ≈ 3.84
  3. 结论:由于 \(3.33 < 3.84\),因此该变化在 0.05 水平上不具有统计显著性。

实际影响: 根据本样本,新的教学方法并未在学生表现上产生显著的提高。


常见问题:解答常见问题

问题 1:McNemar 检验的假设有哪些?

  • 配对观察:必须对同一主体进行两次测量。
  • 二元结果:回复必须属于两个类别(例如,成功/失败)。
  • 配对内独立性:每个主体的回复不应影响其他主体的回复。

问题 2:McNemar 检验可以处理大样本量吗?

可以,但对于非常大的样本,即使是很小的差异也可能变得具有统计显著性。始终在上下文中解释结果。

问题 3:如果 B + C = 0 怎么办?

如果没有不一致的配对(\(B = 0\) 且 \(C = 0\)),则无法应用 McNemar 检验,因为除以零是未定义的。在这种情况下,请考虑使用 Fisher 精确检验等替代检验。


关键术语词汇表

  • 列联表: 以表格形式表示的分类数据,显示结果组合的频率。
  • 不一致配对: 个体在测量之间更改类别的情况。
  • 配对数据: 从不同条件下同一主体获得的观察结果。
  • 统计显著性: 观察到的差异并非由随机机会引起的可能性。

关于 McNemar 检验的有趣事实

  1. 历史渊源: 以心理学家奎因·麦克内马尔 (Quinn McNemar) 的名字命名,他于 1947 年引入该检验来分析心理评估的变化。

  2. 多功能性: 虽然最初设计用于二元结果,但 McNemar 检验可以使用 Cochran 的 Q 检验扩展到多项数据。

  3. 现实世界的影响: 广泛应用于临床试验、教育研究和市场调研中,以衡量干预或活动的效果。