相互作用の変数間の相関関係は重要ですか?


8

モデルを近似するとします。とが相関している場合、相互作用効果の推定に実際的な影響はありますか?y=バツ1+バツ2+バツ1×バツ2バツ1バツ2

とが非常に相関している場合、共線性の問題が発生する可能性があることを理解していますが、それは相互作用項に影響を与えるべきではありませんか?x1x2


1
とが相関しているとき、と間の相関に関する情報をいるようです。推定できることを理解する1つの方法は、いずれかに定数(たとえば)を追加しても相関は変化しないが、が定数プラス変化することにことです。これらの最後の2つの項は、がと間の相関に大きな影響を与えることを示していこれで質問の答えがすぐにわからない場合は、散布図を描くことを検討してください。x 1 x 1 x 2 c x i x 1 x 2x 1 x 2 + c x 1 + c x 2c x 1 x 2 x ix1x2x1x1x2cxix1x2(x1x2+cx1+cx2).cx1x2xi
whuber

@whuber私はあなたの論理に従うのに問題があります-あなたがリンクできるより明確な段階的な説明がありますか?相関式で
書き出そ

@whuberまた、私の元の質問に関しては、かなり漠然としているので、いくつかのコンテキストが役立つと思います。何が起こったのかというと、相互作用の効果を探すための結果を、一緒に働いている統計学者に提示しました。彼が最初に尋ねたのは、相互作用の2つの予測子が相関しているかどうかです。私は相関関係を調べていなかったので、なぜそれが重要なのか尋ねました。彼はその理由を完全には説明できませんでしたが、それが問題であると述べたので、私の質問です。
hlinee 2018

回答:


9

統計コンサルタントが相互作用を線形モデルに導入すると相関構造に悪影響を及ぼす可能性がある理由を説明できなかった理由があります。それは状況に依存し、一般に悪影響があるとは限りません。 下の散布図の行列に示されているデータセットを見て、2つの変数がそれらの積に関連している可能性があるさまざまな方法をすべて確認してください。

この投稿の残りの部分では、これらの数値がどのようにして生成されたかを説明し、状況についてより多くの洞察を提供する可能性があります。


まず、明らかな方法を説明しますx3=x1x2,書くと、3つの変数含む重回帰があります 共線性の問題があるかどうかは、間の線形関係に依存し それは普遍的です。x1,x2,x3.xi.

何が特別なのこの問題については関係ありおよびその他のつまり、 したがって、誰かがあなたに注意するように忠告した場合、この乗法関係はすべての間である種の多重共線性を数学的に伴うことが予想されるためx3xi;x3=x1x2.xi.

これは、すべての可能なパターンを示すことによって実証できるように、そうではありません。私はすべての可能性を通り抜けるという一歩一歩であなたを疲れさせたくないので、最も例示的なもののいくつかをスケッチしましょう。この研究で使用する基本的なツールは個別に線形変換を行った場合、変数間の相関は変わらないx1,x2xiという観測です つまり、どちらの変数にも定数を自由に乗算し、相関関係を変更せずに結果に他の定数を追加できます。ただし、これらの操作はx1x2x iの間の相関関係を大きく変える可能性があります。xi.

(ほぼ)一定の積

x1x2が一定である可能性があります(これは、回帰に定数が含まれる場合、問題になります)。例を作成するには、x1ゼロ以外の値を生成し、x2=c/x1.を定義します それらの積は、構造上c等しくなります

この例を混乱させるには、c0c.近い値を持つ確率変数に変更します これを行うと、xiとそれらの積の間に少しの相関が生じますが、それほどではありません。ここで、例えば、一例であり、x1ガンマから引き出されている(5)分布とcの平均の正規分布有し、1だけの標準偏差1/100:

図0

xiの相関有しρ12=0.87この例では、との相関x1x2のみである0.060.00.

したがって、線形モデルでx1x2両方を使用すると少し問題が発生する可能性がありますが、x1x2を含めると問題が悪化することはほとんどありません。

非定積

計算をより明確にするために、xiに単位分散があると仮定することもできます。分散をさせx1x2であるτ2及び書き込みρ12i間の相関のためにx1x2及びxi. 定数cixi.から差し引かれたときにこれらの相関関係がどうなるかを計算してみましょうxiは完全に対称的な役割を果たすので( " 1 "を " 2 "に交換するだけです)2"インデックスで)、x 1との相関を計算するだけで十分です:x1:

(*)Cor((x1c1)(x2c2),x1)=Cov((x1c1)(x2c2),x1)Var(x1c1)(x2c2)Varx1=Cov(x1x2c2x1c1x2+c1c2,x1)Var(x1x2c1x2c2x1+c1c2)=τρ121c2c1ρ12τ2c1ρ12c22c1ρ1222c2ρ121+2c1c2ρ12.

製品とのゼロ相関

かかわらずの間に相関関係が何のxi、あるかもしれない私たちが選択することができます(c1,c2)製品は無相関にするためにxi.

前述の分析から、これは、分子のがときに達成されるであろう()はゼロであり、i=1,2:

{0=τρ121c2c1ρ120=τρ122c1c2ρ12

場合ρ1221,で方程式のこのシステム(c1,c2)一意の解を有します。ここで、例えば、のデータセットの散布図行列で100れた値(xi)の相関関係を有する二変量正規分布を有するρ12=0.99が、xiゼロ相関有しx1x2

図1

x1x2xi,

xi

製品との強い相関

()xixi,

x21+x2/100x1x2x1,x1x2.ρ121=0.999878ρ122=0.9898793

図2


パーフェクト!徹底的な説明ありがとうございます:)
hlinee
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.