回答:
スピアマン(S)とピアソン(P)の相関関係は何らかの情報を提供するため、データを調査する場合は両方を計算するのが最適です。簡単に説明すると、Sはランクで計算されるため、単調な関係を表し、Pは真の値で線形関係を表します。
例として、次を設定した場合:
x=(1:100);
y=exp(x); % then,
corr(x,y,'type','Spearman'); % will equal 1, and
corr(x,y,'type','Pearson'); % will be about equal to 0.25
これは、がxとともに単調に増加するため、スピアマン相関は完全ですが、線形ではないため、ピアソン相関は不完全であるためです。
corr(x,log(y),'type','Pearson'); % will equal 1
S> Pがある場合、それは単調ですが線形ではない相関があることを意味するため、両方を行うことは興味深いです。統計に直線性を持たせるのが良いので(簡単です)、(ログなど)に変換を適用することができます。
これにより、相関関係のタイプの違いが理解しやすくなることを願っています。
最短でほぼ正解は次のとおりです。
ピアソンは線形関係をベンチマークし、スピアマンは単調関係をベンチマークします(より一般的なケースはほとんどありませんが、電力のトレードオフがいくつかあります)。
これは統計で頻繁に起こります。あなたの状況に適用できるさまざまな方法があり、どれを選ぶべきかわかりません。検討中の方法の長所と短所、および問題の詳細に基づいて決定を下す必要がありますが、それでも決定は主観的なものであり、同意された「正しい」答えはありません。通常、合理的であると思われる方法でできるだけ多くの方法を試してみて、忍耐力が最終的にどの方法があなたに最良の結果を与えるかを確認することをお勧めします。
ピアソン相関とスピアマン相関の違いは、ピアソンは間隔スケールから取得した測定に最も適しているのに対し、スピアマンは順序スケールから取得した測定により適していることです。間隔スケールの例には、「華氏の温度」と「インチの長さ」が含まれ、個々の単位(1度F、1インチ)が意味を持ちます。「満足度スコア」のようなものは順序型の傾向があります。「5幸福」は「3幸福」よりも幸せであることは明らかですが、「1単位の幸福」の意味のある解釈ができるかどうかは不明です。しかし、合計すると 序数型の多くの測定値は、あなたがあなたの場合に持っているものであり、実際には序数でも間隔でもない測定値になり、解釈するのは困難です。
満足度スコアを変位値スコアに変換してから、それらの合計を操作することをお勧めします。これにより、データの解釈が多少なりやすくなります。しかし、この場合でも、ピアソンとスピアマンのどちらが適切かは明らかではありません。
今日、興味深いコーナーケースに遭遇しました。
非常に少数のサンプルを見ている場合、スピアマンとピアソンの違いは劇的です。
以下の場合、2つの方法はまったく逆の相関を報告します。
スピアマンとピアソンを決める簡単な経験則:
ps上記のグラフを再現するRコードです。
# Script that shows that in some corner cases, the reported correlation for spearman can be
# exactly opposite to that for pearson. In this case, spearman is +0.4 and pearson is -0.4.
y = c(+2.5,-0.5, -0.8, -1)
x = c(+0.2,-3, -2.5,+0.6)
plot(y ~ x,xlim=c(-6,+6),ylim=c(-1,+2.5))
title("Correlation: corner case for Spearman vs. Pearson\nNote that they are exactly opposite each other (-0.4 vs. +0.4)")
abline(v=0)
abline(h=0)
lm1=lm(y ~ x)
abline(lm1,col="red")
spearman = cor(y,x,method="spearman")
pearson = cor(y,x,method="pearson")
legend("topleft",
c("Red line: regression.",
sprintf("Spearman: %.5f",spearman),
sprintf("Pearson: +%.5f",pearson)
))
チャールズの答えに同意している間、私は(厳密に実用的なレベルで)両方の係数を計算し、違いを見ることを提案します。多くの場合、それらはまったく同じであるため、心配する必要はありません。
ただし、それらが異なる場合は、ピアソンの仮定(一定の分散と線形性)を満たしているかどうかを調べる必要があり、これらが満たされていない場合は、おそらくスピアマンを使用した方がよいでしょう。