重回帰で、相互作用が予測子の積としてモデル化され、他のものではないのはなぜですか?


8

多重線形回帰を検討してください。この質問は一見単純そうですが、なぜ予測子X1とX2がある場合、これらの予測子間の相互作用はX1 * X2によって適切に捕捉できるのかを直感的に理解しようとしています。

インタラクションの用語が製品としてモデル化されていることを知っています。それは、それが私が学校で教えられたこと、そしてそれが誰もがそうするように言われていることだからです。私はおそらくいくつかの幾何学的な議論があると思います。

しかし、なぜ積(たとえば、2つの数値特徴であり、一方がダミー変数であり、もう一方が数値であるなどの乗算による追加の複雑さではない)が相互作用を適切にキャプチャするのですか?

「相互作用」がデフォルトで具体的にX1 * X2ではなくデフォルトで別のf(X1、X2)によって最もよくキャプチャされないのはなぜですか?

X1 * X2はX1とX2の符号が同じであるか、またはそうでない状況をキャプチャする可能性があるという考えを見ることができますが、なぜデフォルトでは、相互作用は、たとえばf(X1、X2)= sign(X1 )* f(X1、X2)= X1X2の代わりにsign(X2)?

他の任意のf(X1、X2)を回帰または任意の予測モデルに追加できることを認識していますが、手動コーディングによって相互作用の正確な形状を見つけるのは時間がかかります。X1X2が良い最初の推測であることをどうやって知るのですか?

回答:


6

リグレッサ変数バツ1バツ2間の「相互作用」は、1つのリグレッサと応答の間の関係が他のリグレッサの異なる値に対して異なる完全に線形の関係からの逸脱考えることができます。通常の「相互作用の用語」は、以下で説明される意味で、「最も単純な」そのような出発です。

定義と概念

「線形関係」とは、応答Yバツ(および定数)の線形結合とは独立したゼロ平均誤差εによって異なると仮定する通常のモデルを単に意味しますε

(*)Y=β0+β1バツ1+β2バツ2+ε

最も一般的な意味での「相互作用」は、パラメータが意味β他の変数に依存してもよいです。

具体的には、この2つのリグレッサの例では、一般的に次のように記述します。

β1=β1バツ2 そして β2=β2バツ1

分析

β

β1バツ2=γ0+γ1バツ2+ 小さなエラー1;
β2バツ1=δ0+δ1バツ1+ 小さなエラー2

Y=β0+β1バツ2バツ1+β2バツ1バツ2+ε=β0+γ0+γ1バツ2+ 小さなエラー1バツ1+δ0+δ1バツ1+ 小さなエラー2バツ2+ε=β0+γ0バツ1+δ0バツ2+γ1+δ1バツ1バツ2+

= 小さなエラー1バツ1+ 小さなエラー2バツ2+ε

バツεεβ0

どちらの場合でも、表記法を変更すると、この相互作用の線形近似モデルは次の形式になります。

(**)Y=β0+β1バツ1+β2バツ2+β12バツ1バツ2+ε

ε

β12バツ1バツ2γ1バツ2バツ1δ1


いくつかの結果

Yバツ2

Y=β0+β2バツ2+β1+β12バツ2バツ1+ε

β0+β2バツ2バツ1β1+β2バツ2

fバツ1バツ2=β0+β1バツ1+β2バツ2+β12バツ1バツ2

β12=0。

βバツ12 バツ22 バツ1バツ22 バツ12バツ2


1
これは素敵な詳細な答えです。ありがとうございました。余談ですが、このサイトではTukeyの本への言及が頻繁に見られます。古くても。多分それを読む時間です。
ChilliProject
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.