Rのlm式の相互作用項を解釈するにはどうすればよいですか？

Rではlm()、次のように関数を呼び出すと、

lm.1 = lm(response ~ var1 + var2 + var1 * var2)
summary(lm.1)

これは私と応答変数の線形モデル与えvar1、var2およびそれらの間の相互作用を。しかし、相互作用の項はどの程度正確に数値で解釈されますか？

ドキュメントでは、これはとの間の「クロス」であるvar1と述べていますが、var2正確には「クロス」が何であるかについての説明はありませんでした。

2つの変数間の相互作用を組み込むためにRが計算している正確な数値を知ることは私にとって役立ちます。

r regression

— エンツォ
ソース

Rがこの式の設計行列を作成する方法を具体的に知りたいですか、または、そのような乗法的（「相互作用」）項を近似モデルで解釈する方法にもっと広く関心がありますか？

— モモ

私はこの乗法的な用語を解釈する方法にもっと興味があります。たとえば、線形式（Rの式ではなく、数学の式）を記述したい場合、乗法の項には何を入力すればよいですか？

— Enzo

クロスの意味を説明するには、計算してvar3 <- var 1 * var2から構築する方法を見てくださいlm.2 <- lm(response ~ var1 + var2 + var3)

— James Stanley

だからそれは単にエントリごとの乗算ですか？

— Enzo

@Enzoは、はい、クロスは二つの用語が掛け文字通りです-解釈は、主にするかどうかに依存しますvar1し、var2両方の連続（解釈するのは非常に難しい、私の意見では）、またはこれらのいずれかが、例えば、バイナリカテゴリであるかどうかです（簡単に考慮します。） Peter Flomによるいくつかの解釈例については、この回答を参照してください。stats.stackexchange.com

— James Stanley

回答:

モデルの予測方程式を記述する標準的な方法は次のとおりです。

$\hat y = b_0 + b_1*x_1 + b_2*x_2 + b_{12} * x_1 *x_2$

しかし、これを異なる方法で因数分解すると、相互作用を理解するのが少し簡単になります。

$\hat y = (b_0 + b_2*x_2) + (b_1 + b_{12}*x_2) * x_1$

このファクタリングと我々は、所与の値についてことを確認できのためのy切片でありとに傾きである。したがって、と関係は依存します。 $x_2$ $x_1$ $b_0 + b_2*x_2$ $x_1$ $(b_1 + b_{12}*x_2)$ $y$ $x_1$ $x_2$

$y$ $x_1$ $x_2$ Predict.PlotTkPredict

— グレッグ・スノー
ソース

$x_1$ $x_2$ lm

$y = 4x_1 + 2x_2 + 1.5x_1x_2$

それはあなたが欲しかったことですか？

— ピーターフロム-モニカの回復
ソース

離散変数の観点から相互作用について考えるのが最も簡単です。おそらく、2因子分散分析（2つのグループ化変数（例：性別と年齢のカテゴリー、年齢の3つのレベル））を研究し、それらがいくつかの継続的測定にどのように関連しているか（IQなどの従属変数）を見ているかもしれません。

x1 * x2という用語は、重要である場合、（この些細な、作り上げの例では）IQが性別ごとに年齢のレベルによって異なる動作をすることとして理解できます。たとえば、IQは3つの年齢グループの男性に対して安定しているかもしれませんが、若い女性は若い男性よりも低く、上向きの軌道を持っています（男性の古い年齢グループよりも古い年齢グループの平均が高い）。平均プロットでは、これはグラフの中央にある男性の水平線を意味し、おそらく男性の下で始まり男性の上で終わる女性の45度線を意味します。

要点は、1つの変数（または「X1定数を保持する」）のレベルに沿って移動すると、他の変数で行われていることが変化するということです。この解釈は連続予測子変数でも機能しますが、具体的に説明するのは簡単ではありません。その場合、X1とX2の特定の値を取得して、Yに何が起こるかを確認することができます。

— Twitch_City
ソース