什么是秩和检验？-世界杯决-乒乓球世界杯几年一次_世界杯冠军

秩和检验是一种非参数检验方法，主要用于比较两个或多个独立样本或配对样本的分布是否相同。

一、适用情况

数据不满足参数检验假设：

当数据不服从正态分布、方差不齐或总体分布未知时，秩和检验是一种合适的选择。例如，一些社会经济数据、生物医学数据可能不满足正态分布假设，此时使用秩和检验可以避免因错误使用参数检验而导致的错误结论。

比如，比较两种不同治疗方法对患者疼痛程度的影响，疼痛程度数据可能不呈正态分布，这时可以采用秩和检验。

小样本数据：

在样本量较小的情况下，参数检验的效力可能会降低，而秩和检验相对较为稳健。特别是当样本量小于 30 时，秩和检验常常是更好的选择。

例如，在一项小型医学实验中，只有十几名患者参与，比较两种药物的疗效，由于样本量小且数据可能不满足正态分布，使用秩和检验更为可靠。

有序数据：

对于有序分类数据（如等级数据），秩和检验可以有效地比较不同组之间的差异。例如，将患者的病情分为 “轻度”“中度”“重度” 三个等级，比较不同治疗方法对病情等级的影响，可以使用秩和检验。

二、基本原理

对于两个独立样本的秩和检验（Wilcoxon 秩和检验或 Mann-Whitney U 检验）：

将两个样本合并后进行排序，得到每个数据的秩次。然后分别计算两个样本的秩和。如果两个样本来自相同的总体分布，那么它们的秩和应该相近；反之，如果两个样本的分布不同，它们的秩和会有较大差异。

通过比较两个样本的秩和大小，以及根据特定的统计量计算和参考分布，来判断两个样本是否来自不同的总体分布。

对于多个独立样本的秩和检验（Kruskal-Wallis 检验）：

同样将多个样本合并后进行排序，得到每个数据的秩次。然后计算每个样本的秩和。如果多个样本来自相同的总体分布，那么它们的秩和应该在一定范围内波动；反之，如果样本之间存在差异，它们的秩和会有明显的不同。

通过计算统计量 H，并与特定的分布进行比较，来判断多个样本是否来自不同的总体分布。

对于配对样本的秩和检验（Wilcoxon 符号秩检验）：

计算配对数据的差值，对差值进行排序并赋予秩次。如果配对数据来自相同的总体分布，那么差值的秩和应该接近零；反之，如果存在差异，差值的秩和会偏离零。

通过比较差值的正秩和与负秩和的大小，以及计算特定的统计量，来判断配对样本是否存在差异。

三、主要步骤

提出假设：

对于两个独立样本，原假设为两个样本来自相同的总体分布；备择假设为两个样本来自不同的总体分布。

对于多个独立样本，原假设为多个样本来自相同的总体分布；备择假设为多个样本不全来自相同的总体分布。

对于配对样本，原假设为配对数据的差值来自对称分布（即总体中位数为零）；备择假设为配对数据的差值不来自对称分布。

计算秩和：

根据不同的检验类型，将样本数据进行合并排序，计算相应的秩和。

确定统计量：

根据秩和计算出特定的统计量，如 Wilcoxon 秩和检验的 W 统计量、Kruskal-Wallis 检验的 H 统计量、Wilcoxon 符号秩检验的 T 统计量等。

确定 P 值：

通过查特定的统计量表或使用统计软件，确定统计量对应的 P 值。

做出结论：

如果 P 值小于预先设定的显著性水平（通常为 0.05），则拒绝原假设，认为样本之间存在显著差异；如果 P 值大于显著性水平，则接受原假设，认为样本之间无显著差异。

四、优点

对数据分布要求宽松：

不依赖于总体分布的具体形式，适用于各种分布形态的数据，具有广泛的适用性。

对异常值不敏感：

具有较好的稳健性，即使数据中存在异常值，也能提供较为可靠的结果。

计算简单：

主要涉及数据的排序和秩和计算，相对容易理解和操作。

五、缺点

检验效能相对较低：

在总体分布符合参数检验假设的情况下，参数检验通常比秩和检验具有更高的检验效能。

对样本量要求相对较高：

为了达到与参数检验相同的检验效能，通常需要较大的样本量。

结果解释相对复杂：

结果基于秩次，对于不熟悉非参数检验的人来说，理解和解释可能有一定难度。

秩和检验

互联网

喜欢作者

我要约稿