秩和检验是一种非参数检验方法,主要用于比较两个或多个独立样本或配对样本的分布是否相同。
一、适用情况
数据不满足参数检验假设:
当数据不服从正态分布、方差不齐或总体分布未知时,秩和检验是一种合适的选择。例如,一些社会经济数据、生物医学数据可能不满足正态分布假设,此时使用秩和检验可以避免因错误使用参数检验而导致的错误结论。
比如,比较两种不同治疗方法对患者疼痛程度的影响,疼痛程度数据可能不呈正态分布,这时可以采用秩和检验。
小样本数据:
在样本量较小的情况下,参数检验的效力可能会降低,而秩和检验相对较为稳健。特别是当样本量小于 30 时,秩和检验常常是更好的选择。
例如,在一项小型医学实验中,只有十几名患者参与,比较两种药物的疗效,由于样本量小且数据可能不满足正态分布,使用秩和检验更为可靠。
有序数据:
对于有序分类数据(如等级数据),秩和检验可以有效地比较不同组之间的差异。例如,将患者的病情分为 “轻度”“中度”“重度” 三个等级,比较不同治疗方法对病情等级的影响,可以使用秩和检验。
二、基本原理
对于两个独立样本的秩和检验(Wilcoxon 秩和检验或 Mann-Whitney U 检验):
将两个样本合并后进行排序,得到每个数据的秩次。然后分别计算两个样本的秩和。如果两个样本来自相同的总体分布,那么它们的秩和应该相近;反之,如果两个样本的分布不同,它们的秩和会有较大差异。
通过比较两个样本的秩和大小,以及根据特定的统计量计算和参考分布,来判断两个样本是否来自不同的总体分布。
对于多个独立样本的秩和检验(Kruskal-Wallis 检验):
同样将多个样本合并后进行排序,得到每个数据的秩次。然后计算每个样本的秩和。如果多个样本来自相同的总体分布,那么它们的秩和应该在一定范围内波动;反之,如果样本之间存在差异,它们的秩和会有明显的不同。
通过计算统计量 H,并与特定的分布进行比较,来判断多个样本是否来自不同的总体分布。
对于配对样本的秩和检验(Wilcoxon 符号秩检验):
计算配对数据的差值,对差值进行排序并赋予秩次。如果配对数据来自相同的总体分布,那么差值的秩和应该接近零;反之,如果存在差异,差值的秩和会偏离零。
通过比较差值的正秩和与负秩和的大小,以及计算特定的统计量,来判断配对样本是否存在差异。
三、主要步骤
提出假设:
对于两个独立样本,原假设为两个样本来自相同的总体分布;备择假设为两个样本来自不同的总体分布。
对于多个独立样本,原假设为多个样本来自相同的总体分布;备择假设为多个样本不全来自相同的总体分布。
对于配对样本,原假设为配对数据的差值来自对称分布(即总体中位数为零);备择假设为配对数据的差值不来自对称分布。
计算秩和:
根据不同的检验类型,将样本数据进行合并排序,计算相应的秩和。
确定统计量:
根据秩和计算出特定的统计量,如 Wilcoxon 秩和检验的 W 统计量、Kruskal-Wallis 检验的 H 统计量、Wilcoxon 符号秩检验的 T 统计量等。
确定 P 值:
通过查特定的统计量表或使用统计软件,确定统计量对应的 P 值。
做出结论:
如果 P 值小于预先设定的显著性水平(通常为 0.05),则拒绝原假设,认为样本之间存在显著差异;如果 P 值大于显著性水平,则接受原假设,认为样本之间无显著差异。
四、优点
对数据分布要求宽松:
不依赖于总体分布的具体形式,适用于各种分布形态的数据,具有广泛的适用性。
对异常值不敏感:
具有较好的稳健性,即使数据中存在异常值,也能提供较为可靠的结果。
计算简单:
主要涉及数据的排序和秩和计算,相对容易理解和操作。
五、缺点
检验效能相对较低:
在总体分布符合参数检验假设的情况下,参数检验通常比秩和检验具有更高的检验效能。
对样本量要求相对较高:
为了达到与参数检验相同的检验效能,通常需要较大的样本量。
结果解释相对复杂:
结果基于秩次,对于不熟悉非参数检验的人来说,理解和解释可能有一定难度。
秩和检验
互联网
喜欢作者
我要约稿
上一篇
|
下一篇