主効果を含めずにモデルに双方向の相互作用を含めることは有効ですか?仮説が相互作用のみに関するものである場合、主効果を含める必要がありますか?
主効果を含めずにモデルに双方向の相互作用を含めることは有効ですか?仮説が相互作用のみに関するものである場合、主効果を含める必要がありますか?
回答:
私の経験では、高次の効果に接続されている場合、モデルにすべての低次の効果があることが必要であるだけでなく、関心のある相互作用の要因。これは、とx 2の間の相互作用がx 3とx 4の主な効果の代役になる可能性があるためです。相互作用は、省略された変数または省略された非線形(例えば、スプライン)項と共線的であるため、時々必要と思われます。
有効かどうかを尋ねます。一般的な例を挙げましょう。その説明から、追加の分析アプローチが提案されるかもしれません。
相互作用の最も単純な例は、1つの従属変数と2つの独立変数X、Yが次の形式のモデルです。
ランダム用語変数ゼロ期待を有し、パラメータを使用してα 、β '、γ '、およびδ '。これは、かどうかをチェックし、多くの場合、価値があるδが「近いβを「γ 」と同じモデルの代数的に等価な式であるため、
(ここで、、など)。
どこから、仮定する理由があるかどう、我々は誤差項でそれを吸収することができε。これは「純粋な相互作用」を提供するだけでなく、一定の条件なしで提供します。 これは、対数を取ることを強くお勧めします。残差のいくらかの不均一分散性、つまり、Zの大きな値に関連する残差が絶対値で平均よりも大きくなる傾向も、この方向を指します。次に、別の定式化を検討したいと思います。
IIDランダムエラーと。私たちが予想される場合はさらに、β Xをし、γ Yをに比べて大きいことが1、我々はだけではなく、モデルを提案します
この新しいモデルは、ただ1つのパラメータ有する代わりに四つのパラメータ(のα、β '(二次の関係に、等)被験者δ ' = β ' γ '、かなり簡略化)。
これが必要な、または唯一のステップであると言っているわけではありませんが、この種のモデルの代数的再配置は、相互作用のみが重要であると思われる場合は常に検討する価値があることを示唆しています。
相互作用、特に2つと3つの独立変数を使用したモデルを探索するための優れた方法のいくつかは、TukeyのEDAの10〜13章に記載されています。
教科書では、対応する主な効果のないモデルに相互作用を含めるべきではないことがしばしば述べられていますが、これが完全に理にかなっている例は確かにあります。私が想像できる最も簡単な例を挙げましょう。
2つのグループにランダムに割り当てられた被験者を2回測定するとします。1回はベースライン(ランダム化直後)と1回はグループTが何らかの治療を受けた後、1回はグループCは測定しません。これらのデータの反復測定モデルには、測定機会の主効果(ベースラインが0、追跡調査が1のダミー変数)とグループダミー間の相互作用項(Cが0、Tが1)が含まれます。 )および時間ダミー。
モデルインターセプトは、ベースラインでの被験者の平均スコアを推定します(被験者が属しているグループに関係なく)。測定機会ダミーの係数は、ベースラインとフォローアップの間のコントロールグループの変化を示します。また、相互作用項の係数は、コントロールグループと比較して、治療グループでの変化がどれだけ大きい/小さいかを示します。
ここでは、グループの主効果を含める必要はありません。ベースラインでは、グループはランダム化により定義上同等であるためです。
もちろん、グループの主な効果を含める必要があると主張することもできます。そのため、ランダム化が失敗した場合、分析によってこれが明らかになります。ただし、これは、2つのグループのベースライン平均を相互にテストすることと同等です。また、ランダム化された研究のベースラインの違いをテストすることに眉をひそめる人はたくさんいます(もちろん、それが有用だと思う人もたくさんいますが、これは別の問題です)。
モデルで主な効果を維持する理由は、識別可能性のためです。したがって、目的が各効果に関する統計的推論である場合、モデル内の主な効果を維持する必要があります。ただし、モデリングの目的が新しい値の予測のみである場合、予測精度が向上する場合は相互作用のみを含めることは完全に合法です。
これは、他の人が出した回答の多くで暗示されていますが、単純な点は、モデルは積項であるが、モデレーターとプレディクターのw /&w / oは異なるモデルであるということです。把握、各手段はどのようなあなたがモデリングされているプロセスを特定し、モデルW / O司会&予測因子は、あなたの理論や仮説与えられた多くの理にかなっているかどうか。積項が重要であることが、司会&予測因子が含まれていない場合にのみ観察は、あなたのワット/ OA説得力のある説明(多分あなたは「意義」のために周りの釣りしていることを除いて)何も教えてくれない理由、それはそれらを残すために理にかなっていると。
おそらく、それはあなたがあなたのモデルを使用しているものに依存します。しかし、仮説が相互作用のみに関する場合でも、主効果のあるモデルを実行および記述しない理由は見たことがありません。
私は本から段落を借りますStataのを使用して生存分析に導入することによりM.Cleves、R.Gutierrez、W.Gould、Y.Marchenkoで編集Stataのプレスあなたの質問に答えるために。
相互作用効果は、対応する主効果も含まれている場合にのみモデルに含める必要があると読むのが一般的ですが、相互作用効果を単独で含めることには何の問題もありません。[...]研究者の目標は、単に処方箋に従うだけではなく、目前の問題を考慮して、データに当てはまる可能性が合理的に高いと思われるものをパラメータ化することです。
xとyは両方ともxyと相関します(センタリングを使用してこれを防ぐための特定の手段を講じていない限り)。したがって、アプローチで実質的な相互作用効果が得られた場合、相互作用を装った1つ以上の主な効果になります。これにより、明確で解釈可能な結果が得られません。望ましいのは、x、y、および(好ましくは後続のステップで)xyを含めることにより、主な効果が何を行うかを超えて相互作用がどの程度説明できるかを確認することです。
用語に関して:はい、β0は「定数」と呼ばれます。一方、「部分的」には回帰において特定の意味があるため、ここではその用語を使用して戦略を説明しません。
自然界には、相互作用効果とそれを説明する法律のみを含むさまざまなプロセスがあります。たとえば、オームの法則。心理学では、たとえば、Vroom(1964)のパフォーマンスモデルがあります:パフォーマンス=能力x動機付け。今、この法則が当てはまる場合、重要な相互作用効果を見つけることが期待できます。残念ながら、そうではありません。2つの主な効果と取るに足らない相互作用効果を簡単に見つけることができます(デモンストレーションと詳細な説明については、Landsheer、van den WittenboerおよびMaassen(2006)、Social Science Research 35、274-294を参照してください)。線形モデルは、相互作用効果の検出にはあまり適していません。オームは、線形モデルを使用していたときに彼の法則を見つけたことがなかったかもしれません。
その結果、線形モデルでの相互作用効果の解釈は困難です。相互作用効果を予測する理論がある場合は、重要でない場合でもそれを含める必要があります。あなたの理論がそれらを除外する場合、主効果を無視したいかもしれませんが、乗算効果のみを持つ真のデータ生成メカニズムの場合に重要な主効果がしばしば見られるので、あなたはそれを難しく感じるでしょう。
私の答えは次のとおりです。はい、主効果を含めずに双方向の相互作用をモデルに含めることは有効です。線形モデルは、さまざまなデータ生成メカニズムの結果を近似する優れたツールですが、その式は、データ生成メカニズムの有効な説明として簡単に解釈することはできません。
これはトリッキーで、私の最後のプロジェクトで私に起こりました。このように説明します。変数AとBが独立して重要であり、ビジネスの感覚からすると、AとBの相互作用は良いようだと考えたとしましょう。重要であると判明した相互作用を含めましたが、Bはその重要性を失いました。最初に2つの結果を表示して、モデルを説明します。結果は、最初はBが有意であったが、Aに照らして見ると光沢が失われたことを示します。したがって、Bは適切な変数ですが、Aのさまざまなレベルに照らして見た場合のみです(Aがカテゴリ変数の場合)。そのようなオバマは、そのシール軍の光で見たときに良い指導者であると言っています。したがって、Obama * sealは重要な変数になります。しかし、オバマは一人で見たときほど重要ではないかもしれません。(オバマへの違反はありません、単なる例です。)
主効果のない双方向の相互作用を含めることは有効ですか?
はい、それは有効であり、必要な場合もあります。たとえば2.で主効果の要因(青と赤の条件の平均差)を含めると、モデルが悪化します。
仮説が相互作用のみに関するものである場合、主効果を含める必要がありますか?
あなたの仮説は、主効果があるとは無関係に真であるかもしれません。しかし、モデルは、基礎となるプロセスを最もよく説明するために必要になる場合があります。そうです、ありとなしで試してみてください。
注:「連続」独立変数のコードを中央に配置する必要があります(この例では測定)。そうしないと、モデル内の相互作用係数は対称的に分布しません(例の最初の測定の係数はありません)。
問題の変数がカテゴリカルである場合、主効果のない相互作用を含めることはモデルの再パラメーター化にすぎず、パラメーター化の選択はモデルで達成しようとしていることに依存します。連続変数と他の連続変数、またはカテゴリ変数との相互作用はまったく別の話です。参照:UCLAのデジタル研究教育研究所のこの FAQをご覧ください
はい、これは有効ですが、まれです。ただし、この場合でも、主な効果をモデル化する必要があります。これは後で回帰します。
実際、一部のモデルでは、薬物検査/臨床モデルなどの相互作用のみが興味深いものです。これは、たとえば、一般化された心理生理学的相互作用(gPPI)モデルの基礎です。ボクセル/関心領域はy = ax + bxh + ch
どこにx/y
あり、h
ブロック/イベント設計ますか。
このモデルではa
、c
との両方が回帰され、b
推論(ベータ係数)のみが保持されます。実際、両方のa
およびc
は、私たちの場合の偽の活動を表し、偽の活動b
、タスクとの相互作用によって説明できないものだけを表します。