Skip to content Skip to footer

什么是秩和检验?

秩和检验是一种非参数检验方法,主要用于比较两个或多个独立样本或配对样本的分布是否相同。

一、适用情况

数据不满足参数检验假设:

当数据不服从正态分布、方差不齐或总体分布未知时,秩和检验是一种合适的选择。例如,一些社会经济数据、生物医学数据可能不满足正态分布假设,此时使用秩和检验可以避免因错误使用参数检验而导致的错误结论。

比如,比较两种不同治疗方法对患者疼痛程度的影响,疼痛程度数据可能不呈正态分布,这时可以采用秩和检验。

小样本数据:

在样本量较小的情况下,参数检验的效力可能会降低,而秩和检验相对较为稳健。特别是当样本量小于 30 时,秩和检验常常是更好的选择。

例如,在一项小型医学实验中,只有十几名患者参与,比较两种药物的疗效,由于样本量小且数据可能不满足正态分布,使用秩和检验更为可靠。

有序数据:

对于有序分类数据(如等级数据),秩和检验可以有效地比较不同组之间的差异。例如,将患者的病情分为 “轻度”“中度”“重度” 三个等级,比较不同治疗方法对病情等级的影响,可以使用秩和检验。

二、基本原理

对于两个独立样本的秩和检验(Wilcoxon 秩和检验或 Mann-Whitney U 检验):

将两个样本合并后进行排序,得到每个数据的秩次。然后分别计算两个样本的秩和。如果两个样本来自相同的总体分布,那么它们的秩和应该相近;反之,如果两个样本的分布不同,它们的秩和会有较大差异。

通过比较两个样本的秩和大小,以及根据特定的统计量计算和参考分布,来判断两个样本是否来自不同的总体分布。

对于多个独立样本的秩和检验(Kruskal-Wallis 检验):

同样将多个样本合并后进行排序,得到每个数据的秩次。然后计算每个样本的秩和。如果多个样本来自相同的总体分布,那么它们的秩和应该在一定范围内波动;反之,如果样本之间存在差异,它们的秩和会有明显的不同。

通过计算统计量 H,并与特定的分布进行比较,来判断多个样本是否来自不同的总体分布。

对于配对样本的秩和检验(Wilcoxon 符号秩检验):

计算配对数据的差值,对差值进行排序并赋予秩次。如果配对数据来自相同的总体分布,那么差值的秩和应该接近零;反之,如果存在差异,差值的秩和会偏离零。

通过比较差值的正秩和与负秩和的大小,以及计算特定的统计量,来判断配对样本是否存在差异。

三、主要步骤

提出假设:

对于两个独立样本,原假设为两个样本来自相同的总体分布;备择假设为两个样本来自不同的总体分布。

对于多个独立样本,原假设为多个样本来自相同的总体分布;备择假设为多个样本不全来自相同的总体分布。

对于配对样本,原假设为配对数据的差值来自对称分布(即总体中位数为零);备择假设为配对数据的差值不来自对称分布。

计算秩和:

根据不同的检验类型,将样本数据进行合并排序,计算相应的秩和。

确定统计量:

根据秩和计算出特定的统计量,如 Wilcoxon 秩和检验的 W 统计量、Kruskal-Wallis 检验的 H 统计量、Wilcoxon 符号秩检验的 T 统计量等。

确定 P 值:

通过查特定的统计量表或使用统计软件,确定统计量对应的 P 值。

做出结论:

如果 P 值小于预先设定的显著性水平(通常为 0.05),则拒绝原假设,认为样本之间存在显著差异;如果 P 值大于显著性水平,则接受原假设,认为样本之间无显著差异。

四、优点

对数据分布要求宽松:

不依赖于总体分布的具体形式,适用于各种分布形态的数据,具有广泛的适用性。

对异常值不敏感:

具有较好的稳健性,即使数据中存在异常值,也能提供较为可靠的结果。

计算简单:

主要涉及数据的排序和秩和计算,相对容易理解和操作。

五、缺点

检验效能相对较低:

在总体分布符合参数检验假设的情况下,参数检验通常比秩和检验具有更高的检验效能。

对样本量要求相对较高:

为了达到与参数检验相同的检验效能,通常需要较大的样本量。

结果解释相对复杂:

结果基于秩次,对于不熟悉非参数检验的人来说,理解和解释可能有一定难度。

秩和检验

互联网

喜欢作者

我要约稿

上一篇

|

下一篇

Copyright © 2088 乒乓球世界杯几年一次_世界杯冠军 - salooo.com All Rights Reserved.
友情链接