標準化する前に変数間の相関関係をテストできますか?


7

私がやりたいことは、リソース選択を評価するためのGLMMを構築することであり、変数のセットがあります(距離を表すものと土地被覆の%を表すもの)があります。

標準化する前に変数間の相関関係をテストできますか?最初に何をしたらいいのかよくわかりません。

回答:


11

標準化する前に変数間の相関関係をテストできますか?最初に何をしたらいいのかよくわかりません。

相関関係は、標準化の前と後のどちらで計算しても同じです。これを確認するには、相関がスケールに対して不変であることを知っていれば十分です。bRa> 0を取りa>0

Corr(aXb,Y)=Cov(aXb,Y)Var(aXb)(Var(Y)=Cov(aX,Y)Var(aX)Var(Y)=aCov(X,Y)a2Var(X)Var(Y)=aCov(X,Y)aVar(X)Var(Y)=Cov(X,Y)Var(X)Var(Y)=Corr(X,Y)

最初の等式は定義です。
2つ目は、共分散と分散が位置シフトに対して不変であるという特性を使用します。
3番目は、定数の乗算に関する共分散と分散の特性を使用します。
4番目は、という事実を使用し。 5番目は、乗算器をキャンセルするだけです。 6番目は再び定義です。a>0

これは、平均を差し引き、標準偏差(正の数)で除算する標準化をカバーしています。


回答ありがとうございます。非常に明確になっています。
mtao 2016年

5

はい、説明変数間の相関関係の検証は、Zuur et alで提案されているように、データ探索の一部です。(2010)一般的な統計上の問題を回避するためのデータ探索のプロトコル。これは、それらを標準化してGLMMを構築する前に行う必要があります。

ただし、説明変数を最初に標準化した場合に相関にどのように影響するかはわかりませんが、相関の結果は比較的同じだと思います。


4

両方の答えに+1しますが、明白なことを述べるだけです。

線形相関は、2つの変数間の共分散のスケーリングれたバージョンとして定義されます。スケーリング自体は、単に2つの変数の標準偏差の積です。したがって、共分散に影響を与える可能性のある以前の再スケーリング効果は最終的な相関推定値を与えるスケール正規化によって無効になるため、標準化(またはその点について調べた変数の線形変換)は相関を変更しません。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.