Python广告数据挖掘与分析实战
上QQ阅读APP看书,第一时间看更新

2.4.2 Spearman秩相关系数

Spearman秩相关系数的适用范围比Pearson相关系数广,它是用来衡量秩序的相关性的。Spearman相关系数的突出特点是单调性相关,也就是只要X和Y具有单调的函数关系,那么X和Y就是完全Spearman相关的。这与Pearson相关不同,Pearson相关只有在变量之间具有线性关系时才是完全相关的,其次,Spearman相关系数不需要先验知识,只要知道参数就可以准确获取X和Y的概率分布。Spearman秩相关系数ρ的计算公式如下:

其中,di为两个秩序之间的距离,n代表样本个数。

在正态分布的假设下,Pearson相关系数和Spearman秩相关系数在效率上是等价的,而对于连续型测量数据,更适合用Pearson相关系数来进行分析。在实际应用中,上述两种相关系数都需要对其进行假设检验,可以使用t检验方法检验其显著性水平以及确定其相关程度。