回帰では、相互作用の用語は関連する両方の直接的な影響を一掃します。インタラクションをドロップするか、結果を報告しますか?相互作用は元の仮説の一部ではありませんでした。
回帰では、相互作用の用語は関連する両方の直接的な影響を一掃します。インタラクションをドロップするか、結果を報告しますか?相互作用は元の仮説の一部ではありませんでした。
回答:
これは難しいと思います。あなたが示唆するように、ここには「モラルハザード」があります:相互作用をまったく見ていないなら、あなたは自由で明確になりますが、それをドロップするとデータdataの疑いがあります。
重要なのは、主効果のみから相互作用モデルに移行したときの効果の意味の変化でしょう。「主な効果」で得られるものは、治療とコントラストがどのようにコーディングされているかに大きく依存します。Rでは、デフォルトは、ベースラインレベルとしての最初の因子レベル(別の方法でコードを書き出さない限り、アルファベット順の名前を持つもの)との対比です。
(簡単にするために)各要因に対して、「control」と「trt」の2つのレベルがあるとしましょう。相互作用がない場合、「v1.trt」パラメーターの意味(Rのデフォルトが治療のコントラストであると仮定)は「「v1.control」と「v1.trt」グループの平均差」です。「v2.trt」パラメータの意味は「「v2.control」と「v2.trt」の平均差」です。
インタラクションでは、「v1.trt」は「v2.control」グループの「v1.control」と「v1.trt」の平均差であり、同様に「v2.trt」は「v2.trt」の「v1.control」グループ。したがって、各コントロールグループでかなり小さい治療効果があり、治療グループで大きな効果がある場合、見ているものを簡単に見ることができます。
ただし、重要な相互作用用語なしでこれが発生するのを確認できる唯一の方法は、すべての効果がかなり弱い場合です(つまり、「効果が消えた」という意味は、p = 0.06からp = 0.04になったことです。魔法の重要な線を越えて)。
もう1つの可能性は、「自由度を使いすぎている」ことです。つまり、パラメーターの推定値は実際にはそれほど変化しませんが、残りの4 [=(2- 1)*(5-1)]重要な用語が重要ではなくなるパラメーター。繰り返しますが、これは小さなデータセット/比較的弱い効果でのみ期待されます。
考えられる解決策の1つは、コントラストを合計することです。ただし、これもデリケートです。「平均効果」はあなたの場合に意味があると確信する必要があります。最良の方法は、データをプロットし、係数を調べて、推定パラメーターに関して何が起きているかを理解することです。
お役に立てば幸いです。
変数は適切に表現されていますか?2つの独立変数と考えます。問題文は、あなたがフォームにうまく適合していると断言しますX 2
残差の分散がとともに増加するという証拠がある場合、より良いモデルは乗法誤差を使用します。
これは書き直すことができます
つまり、フォームで変数を再表現する場合
その場合、モデルは線形であり、おそらくホモセダスティックな残差があります。
この分析は、一部のアプリケーションでも、おそらく相互作用のみの効果があるように見えるモデルを持つことができることを示しています。これは、変数(独立、依存、または両方)が不適切な形式で表示され、その対数がモデリングのより効果的なターゲットである場合に発生します。変数と初期残差の分布は、これが当てはまるかどうかを判断するために必要な手がかりを提供します:変数の歪んだ分布と残差の不均一分散(具体的には、予測値にほぼ比例する分散を持つ)は指標です。
製品は元の両方の変数と強く相関するため、これは通常、高い多重共線性をもたらします。多重共線性では、個々のパラメーター推定値は、他の変数が考慮されることに強く依存します-あなたの場合のように。対策として、変数を中央に配置すると、相互作用を考慮したときに多重共線性が低下することがよくあります。
カテゴリー予測子を持っているように見えますが、「ANOVA」の代わりに「回帰」という用語を使用しているため、これがあなたのケースに直接適用されるかどうかはわかりません。もちろん、後者の場合も基本的に同じモデルですが、ベンが説明したようにコントラストコーディングスキームを選択した後でのみです。
これは、解釈の問題、いわゆる「直接効果」係数が実際に何であるかを誤解している可能性があります。
連続予測変数と相互作用項のない回帰モデル(つまり、他の項の積として構築される項がない)では、各変数の係数はその変数の方向の回帰曲面の勾配です。変数の値に関係なく一定であり、明らかにその変数の効果の尺度です。
相互作用のあるモデル、つまり、他の用語の積として構築された用語では、相互作用に関係しない変数についてのみ、さらなる修飾なしで解釈を行うことができます。変数の係数れる相互作用に関与は、その変数の方向に回帰面の傾きであるすべての変数の値は、問題の変数との相互作用がゼロであることとき、係数の有意差検定を指します予測子空間のその領域のみでの回帰曲面の勾配。空間のその領域に実際にデータが存在する必要はないため、見かけの直接効果係数は、データが実際に観測された予測子空間の領域の回帰曲面の勾配にほとんど似ていない場合があります。そのような場合、真の「直接効果」はありません。最適な代替は、おそらく「平均効果」です。つまり、各データポイントで取得され、すべてのデータポイントで平均化された、問題の変数の方向の回帰曲面の勾配です。これについて詳しくは、独立変数を中央に配置することで節度によって主効果が変わるのはなぜですか?を参照してください。