ログの変換と相関


6

アフリカの農村市場で魚の価格を調査しています。Spearmanを使用して、重量と価格の相関度をテストしました。これにより、値は.773になりました。次に、価格のlog10を取り、相関関係を再テストしたところ、同じスピアマンの値.773が得られました。これは奇妙に思われます。なぜなら、変換によって相関が弱まるか、または低くなると考えたからです(たとえば、時間の経過に伴う細菌コロニーの成長を指数関数から線形に変換するなど)。

すべての変数が変換によって同じように影響を受けるため、相関関係は変化しないことを理解しています。ただし、散布図は質的に異なるため、相関係数も同じようにすべきではありませんか?ここに画像の説明を入力してください

回答:


12

単調連合のスピアマン相関テスト(一緒に増加し、一緒に減少する傾向); 単調増加変換(対数、平方根、正の値の2乗など)の影響を受けません。

スピアマン相関には、これらはすべて完全に相関しています。

ここに画像の説明を入力してください

...各変数は他の変数と同様に(量は異なりますが)増加するためです。

どちらか一方を変換したときに相関が変化すると予想される場合は、おそらくピアソン相関のようなものを考えているでしょう。これは線形関連を測定し、単調変換の影響を受けます。

(ちなみに、ピアソン相関に変換したい場合は、ログを取得して両方の変数を変換することを検討することをお勧めします。)


6

違いが見られない理由は、ピアソンの相関ではなくスピアマンの相関を計算しているためです。後者は線形関連の尺度ですが、スピアマンの相関関係は任意の単調関係の強さを測定します。これは単調変換に対して不変でなければなりません。

スピアマンの相関を計算する方法は、最初に観測値をランクに変換し、次にピアソンの相関を適用することです。単調増加変換(対数など)は観測の順序を変更しないため、変換を適用する前とまったく同じランクが得られ、スピアマンの相関に同じ値が得られます。


4

スピアマンの相関係数は、実際のデータ値ではなくランクを使用します。データ値をランクに変換しているので、スピアマンの相関の使用は実際にはすでに変換です。

対数変換は変数の値を変更しますが、相互の値のランキングを変更しません。したがって、スピアマン相関係数は変更されません。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.