変数の対数変換の前または後に相関を取る


9

対数変換を行う前または後に、2つの確率変数XおよびYのピアソン相関を計算する必要があるかどうかに関する一般原則はありますか?より適切なテスト手順はありますか?対数変換は非線形であるため、値は似ていますが異なる値になります。XまたはYがログ後に正常に近いかどうかに依存しますか?もしそうなら、それはなぜ問題なのですか?これは、XとYとlog(X)とlog(Y)の正規性検定を行う必要があることを意味し、それに基づいて、pearson(x、y)がpearson(log(x)、log( y))?


@vinuxには良い答えがあり、相関における正規性の役割を理解するための有益なリンクを提供します。私はこの質問を指摘したいと思います:stats.stackexchange.com/questions/298これは、回帰でログが何を行うかを理解するのに非常に適しています。
ガン-モニカの復活

回答:


5

のでとデータの単調変換されていると、あなたはまた、使用することを選択するかもしれませんスピアマンの順位相関(あなたはなるだろうとして、あなたのデータを変換について)およびない心配をログY X Y ρ S ρ SX Y = ρ SログX 対数Y log(X)log(Y)XYρSρS(X,Y)=ρS(log(X),log(Y))


4

Correlation(pearson)は、2つの連続変数間の線形関係を測定します。(X、Y)または(log X、log Y)にはそのような選択はありません。変数の散布図は、関係を理解するために使用できます。

次のリンクは、正常性の問題に関して回答する場合があります。リンク


-3

ピアソン相関はパラメトリックテスト用であり、非パラメーターテストよりも強力です。したがって、ノンパラメトリック手順の前に変換を使用することを選択します。データを変換し、ピアソンの相関を取得します。それでおしまい。


@ abi:サンプルサイズに応じて、SpearmanとKendallの係数は、パワーとMSEの点で、正規分布データのPearsonの係数と比較的類似しており、わずかなデータ汚染でもはるかに優れています。
Patrick
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.