相互作用によって回帰の直接的な影響がなくなるとどうなりますか?


25

回帰では、相互作用の用語は関連する両方の直接的な影響を一掃します。インタラクションをドロップするか、結果を報告しますか?相互作用は元の仮説の一部ではありませんでした。


6
実験計画、研究の質問、統計モデルに関する詳細を提供すれば、おそらくより良い答えが得られるでしょう。
デビッドルバウアー

調査データがあります。v1とv2は、予想どおり結果を予測します。ただし、v1(二分法)とv2(5グループ)の相互作用は重要ではありません-(私の質問)これにより、v1とv2の直接効果も重要ではなくなります。これを報告する例は文献にありません。
ジェン

v1:v2の相互作用が重要でない場合、それをモデルに含める必要がありますか?
クリストファーアデン

たぶんこの質問は関連していますか? stats.stackexchange.com/questions/5184/...
グレン

別の可能性は、逆説的交絡ある:例1:epm.sagepub.com/content/56/3/430.abstract例2:optimalprediction.com/files/pdf/V1A19.pdf
user31256

回答:


24

これは難しいと思います。あなたが示唆するように、ここには「モラルハザード」があります:相互作用をまったく見ていないなら、あなたは自由で明確になりますが、それをドロップするとデータdataの疑いがあります。

重要なのは、主効果のみから相互作用モデルに移行したときの効果の意味の変化でしょう。「主な効果」で得られるものは、治療とコントラストがどのようにコーディングされているかに大きく依存します。Rでは、デフォルトは、ベースラインレベルとしての最初の因子レベル(別の方法でコードを書き出さない限り、アルファベット順の名前を持つもの)との対比です。

(簡単にするために)各要因に対して、「control」と「trt」の2つのレベルがあるとしましょう。相互作用がない場合、「v1.trt」パラメーターの意味(Rのデフォルトが治療のコントラストであると仮定)は「「v1.control」と「v1.trt」グループの平均差」です。「v2.trt」パラメータの意味は「「v2.control」と「v2.trt」の平均差」です。

インタラクションでは、「v1.trt」は「v2.control」グループの「v1.control」と「v1.trt」の平均差であり、同様に「v2.trt」は「v2.trt」の「v1.control」グループ。したがって、各コントロールグループでかなり小さい治療効果があり、治療グループで大きな効果がある場合、見ているものを簡単に見ることができます。

ただし、重要な相互作用用語なしでこれが発生するのを確認できる唯一の方法は、すべての効果がかなり弱い場合です(つまり、「効果が消えた」という意味は、p = 0.06からp = 0.04になったことです。魔法の重要な線を越えて)。

もう1つの可能性は、「自由度を使いすぎている」ことです。つまり、パラメーターの推定値は実際にはそれほど変化しませんが、残りの4 [=(2- 1)*(5-1)]重要な用語が重要ではなくなるパラメーター。繰り返しますが、これは小さなデータセット/比較的弱い効果でのみ期待されます。

考えられる解決策の1つは、コントラストを合計することです。ただし、これもデリケートです。「平均効果」はあなたの場合に意味があると確信する必要があります。最良の方法は、データをプロットし、係数を調べて、推定パラメーターに関して何が起きているかを理解することです。

お役に立てば幸いです。


4
モラルハザードはありません。相互作用を含む主な効果の計算は、それを含まない計算とはまったく異なります。加法モデルを実行して主効果を報告し、とにかく別のモデルに相互作用を含める必要があります。相互作用を含むモデルの主効果は、実際には主効果ではなく、他の予測子の特定のレベル(相互作用を含む)の効果であるため、無視します。
ジョン

ジョン:その論理によって、二次相互作用/緩和効果を評価するモデルの相互作用項も無視します(つまり、(1)主効果、(2)それらの主効果間の相互作用、および(3)二次項を含む)主効果の1つと曲線相互作用効果(節度))
弁当

11

変数は適切に表現されていますか?2つの独立変数と考えます。問題文は、あなたがフォームにうまく適合していると断言しますX 2X1X2

Y=β0+β12X1X2+ϵ

残差の分散がとともに増加するという証拠がある場合、より良いモデルは乗法誤差を使用します。Y

Y=β0+(β12X1X2)δ

これは書き直すことができます

log(Yβ0)=log(β12)+log(X1)+log(X2)+log(δ);

つまり、フォームで変数を再表現する場合

η=log(Yβ0)ξ1=log(X1)ξ2=log(X2)ζ=log(δ)N(0,σ2)

その場合、モデルは線形であり、おそらくホモセダスティックな残差があります。

η=γ0+γ1ξ1+γ2ξ2+ζ,

γ1γ2

β0Y

β0β0

Y=(θ1+X1)(θ2+X2)+ϵ

θ1θ2=β0θ1θ2θ1X2θ2X1ϵ

この分析は、一部のアプリケーションでも、おそらく相互作用のみの効果があるように見えるモデルを持つことができることを示しています。これは、変数(独立、依存、または両方)が不適切な形式で表示され、その対数がモデリングのより効果的なターゲットである場合に発生します。変数と初期残差の分布は、これが当てはまるかどうかを判断するために必要な手がかりを提供します:変数の歪んだ分布と残差の不均一分散(具体的には、予測値にほぼ比例する分散を持つ)は指標です。


うーん。これはすべて理にかなっているように見えますが、私のソリューションよりも複雑です(元の質問に対するコメントは、予測変数が両方ともカテゴリカルであることを示唆しています)。しかし、いつものように、答えは「データを見る」(または残差)です。
ベンボルカー

1
@Ben私は同意しますが、単変量分布の分析と残差の事後分析が回帰演習で不可欠であるため、「より複雑な」という認識がどこから来るのか理解できません。ここで必要な唯一の追加作業は、これらの分析の意味を考えることです。
whuber

1
おそらく「より複雑」というのは、「私の経験では、答え(コントラストコーディング)で言及した問題が、あなたが言及した問題(非加法性)よりも頻繁に発生するのを見た」という意味ですが、これは本当に世界についてではなく、私が扱うデータ/人の種類についての声明。
ベンボルカー

5

Y=β0+β1X1+β2X2+β3(X1X2)=(b0+b2X2)+(b1+b3X2)X1

製品は元の両方の変数と強く相関するため、これは通常、高い多重共線性をもたらします。多重共線性では、個々のパラメーター推定値は、他の変数が考慮されることに強く依存します-あなたの場合のように。対策として、変数を中央に配置すると、相互作用を考慮したときに多重共線性が低下することがよくあります。

カテゴリー予測子を持っているように見えますが、「ANOVA」の代わりに「回帰」という用語を使用しているため、これがあなたのケースに直接適用されるかどうかはわかりません。もちろん、後者の場合も基本的に同じモデルですが、ベンが説明したようにコントラストコーディングスキームを選択した後でのみです。


5

これは、解釈の問題、いわゆる「直接効果」係数が実際に何であるかを誤解している可能性があります。

連続予測変数と相互作用項のない回帰モデル(つまり、他の項の積として構築される項がない)では、各変数の係数はその変数の方向の回帰曲面の勾配です。変数の値に関係なく一定であり、明らかにその変数の効果の尺度です。

相互作用のあるモデル、つまり、他の用語の積として構築された用語では、相互作用に関係しない変数についてのみ、さらなる修飾なしで解釈を行うことができます。変数の係数れる相互作用に関与は、その変数の方向に回帰面の傾きであるすべての変数の値は、問題の変数との相互作用がゼロであることとき、係数の有意差検定を指します予測子空間のその領域のみでの回帰曲面の勾配。空間のその領域に実際にデータが存在する必要はないため、見かけの直接効果係数は、データが実際に観測された予測子空間の領域の回帰曲面の勾配にほとんど似ていない場合があります。そのような場合、真の「直接効果」はありません。最適な代替は、おそらく「平均効果」です。つまり、各データポイントで取得され、すべてのデータポイントで平均化された、問題の変数の方向の回帰曲面の勾配です。これについて詳しくは、独立変数を中央に配置することで節度によって主効果が変わるのはなぜですか?を参照してください

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.