モデル内の主な効果ではなく相互作用を含める


85

主効果を含めずにモデルに双方向の相互作用を含めることは有効ですか?仮説が相互作用のみに関するものである場合、主効果を含める必要がありますか?


3
私の哲学は、多くのモデルを実行し、予測を確認し、比較し、説明し、より多くのモデルを実行することです。
マイケルビショップ

11
主効果がモデル内にあるときにのみ相互作用が重要である場合、主効果が重要であり、相互作用は重要ではない可能性があります。100のオーダの分散を持つ非常に重要な主効果と、すべての値がほぼ1で分散が非常に小さい別の重要でない主効果を考えます。それらの相互作用は重要ではありませんが、主効果がモデルから削除される場合、相互作用効果は重要であるように見えます。
トーマスレヴィン

4
@Thomasの最初の行は、「主効果がモデルにないときにのみ相互作用が重要な場合、...」と読みますか?
グレン

2
ああ、そうだね!
トーマスレバイン

回答:


55

私の経験では、高次の効果に接続されている場合、モデルにすべての低次の効果があることが必要であるだけでなく、関心のある相互作用の要因。これは、x 2の間の相互作用がx 3x 4の主な効果の代役になる可能性があるためです。相互作用は、省略された変数または省略された非線形(例えば、スプライン)項と共線的であるため、時々必要と思われます。バツ1バツ2バツ3バツ4


1
つまり、y〜x1 * x2 * x3 * x4から用語の削除を開始し、最高次の用語、つまり通常の削除方法の削除を開始する必要があります。
好奇心が

9
用語のクラス全体を「チャンク」としてテストできない限り、用語の削除はお勧めしません。たとえば、すべてのインタラクション条件を保持または削除するか、3次または4次のすべてのインタラクションを保持または削除することが合理的です。
フランクハレル

特定の順序でいくつかのインタラクションのみを削除することの何が問題になっていますか?
user1205901

3
データを見て決定されなかった完全に事前に指定された順序がある場合は、それを行うことができます。一般に、複数のP値を使用して複数の決定を行う場合、共直線性と多重度の問題が発生します。
フランクハレル

2
この答えは不明確で、質問には部分的にしか答えていないと感じています。実際、この回答は、主効果をモデル化する必要があると述べていますが、gPPIなどの一部のモデルで使用されている相互作用のみに焦点を当てるために回帰することが有効かどうかは回答しません(私の回答を参照してください)未満)。
18

37

有効かどうかを尋ねます。一般的な例を挙げましょう。その説明から、追加の分析アプローチが提案されるかもしれません。

相互作用の最も単純な例は、1つの従属変数と2つの独立変数XYが次の形式のモデルです。ZXY

Z=α+βX+γY+δXY+ε,

ランダム用語変数ゼロ期待を有し、パラメータを使用してα β 'γ 'およびδ '。これは、かどうかをチェックし、多くの場合、価値があるδが近いβをγ と同じモデルの代数的に等価な式であるため、εα,β,γ,δδβγ

Z=α(1+βX+γY+δXY)+ε

=α(1+βX)(1+γY)+α(δβγ)XY+ε

(ここで、、など)。β=αβ

どこから、仮定する理由があるかどう、我々は誤差項でそれを吸収することができε。これは「純粋な相互作用」を提供するだけでなく、一定の条件なしで提供します。 これは、対数を取ることを強くお勧めします。残差のいくらかの不均一分散性、つまり、Zの大きな値に関連する残差が絶対値で平均よりも大きくなる傾向も、この方向を指します。次に、別の定式化を検討したいと思います。(δβγ)0εZ

log(Z)=log(α)+log(1+βX)+log(1+γY)+τ

IIDランダムエラーと。私たちが予想される場合はさらに、β Xをし、γ Yをに比べて大きいことが1、我々はだけではなく、モデルを提案しますτβXγY1

ログZ=ログα+ログβ+ログγ+ログバツ+ログY+τ

=η+ログバツ+ログY+τ

この新しいモデルは、ただ1つのパラメータ有する代わりに四つのパラメータ(のαβ '(二次の関係に、等)被験者δ ' = β ' γ '、かなり簡略化)。ηαβδ=βγ

これが必要な、または唯一のステップであると言っているわけではありませんが、この種のモデルの代数的再配置は、相互作用のみが重要であると思われる場合は常に検討する価値があることを示唆しています。

相互作用、特に2つと3つの独立変数を使用したモデルを探索するための優れた方法のいくつかは、TukeyのEDAの10〜13章に記載されています。


あなたが想定することができるだろう際の一例を提供することができゼロに近づけるでしょうか?これらの用語を元の用語との関連で考え、それらが何を意味するかを考えるのは困難です。δβγ
ジョッキー

別の製剤は必ずしも意味するものであろう良いモデルである、任意の状況@djhocking における最初のモデル。特殊なケースは最終モデルです。これは、対数Z XおよびYの対数との間の単純な線形関係であり、元のスケールの乗法関係Z X Yに相当します。このような関係は自然界にたくさんあります。つまり、ZXYの両方に直接かつ別々に比例するということです。αδβγ0ログZバツYZバツYZバツY
whuber

30

教科書では、対応する主な効果のないモデルに相互作用を含めるべきではないことがしばしば述べられていますが、これが完全に理にかなっている例は確かにあります。私が想像できる最も簡単な例を挙げましょう。

2つのグループにランダムに割り当てられた被験者を2回測定するとします。1回はベースライン(ランダム化直後)と1回はグループTが何らかの治療を受けた後、1回はグループCは測定しません。これらのデータの反復測定モデルには、測定機会の主効果(ベースラインが0、追跡調査が1のダミー変数)とグループダミー間の相互作用項(Cが0、Tが1)が含まれます。 )および時間ダミー。

モデルインターセプトは、ベースラインでの被験者の平均スコアを推定します(被験者が属しているグループに関係なく)。測定機会ダミーの係数は、ベースラインとフォローアップの間のコントロールグループの変化を示します。また、相互作用項の係数は、コントロールグループと比較して、治療グループでの変化がどれだけ大きい/小さいかを示します。

ここでは、グループの主効果を含める必要はありません。ベースラインでは、グループはランダム化により定義上同等であるためです。

もちろん、グループの主な効果を含める必要があると主張することもできます。そのため、ランダム化が失敗した場合、分析によってこれが明らかになります。ただし、これは、2つのグループのベースライン平均を相互にテストすることと同等です。また、ランダム化された研究のベースラインの違いをテストすることに眉をひそめる人はたくさんいます(もちろん、それが有用だと思う人もたくさんいますが、これは別の問題です)。


4
時間ゼロ(ベースライン)測定が最初の応答変数として使用される場合、問題が発生します。ベースラインは、多くの場合、調査のエントリー基準として使用されます。たとえば、研究では収縮期血圧(bp)が140を超える患者を登録し、2 bpの治療にランダム化してbpsを追跡します。最初は、bpには切り捨てられた分布があり、後の測定はより対称になります。同じモデルで2つの分布形状をモデル化するのは面倒です。ベースラインをベースライン共変量として扱うには、さらに多くの理由があります。
フランクハレル

3
それは良い点ですが、最近の研究はこれが問題ではないことを示唆しています。実際、ベースラインスコアを共変量として使用することには、さらに不利な点があるようです。参照:Liu、GF、et al。(2009)。ベースラインは、臨床試験のベースラインからの変化の分析における共変量または従属変数であるべきですか?医学統計、28、2509-2530。
ヴォルフガング

3
私はその論文を読みました。説得力がなく、notは私が説明したさまざまな種類の臨床試験状況を研究していません。シリアル(縦)データの分析に関する章のbiostat.mc.vanderbilt.edu/wiki/pub/Main/RmS/course2.pdfに、さらに多くの引数があります。
フランクハレル

1
リンクをありがとう。8.2.3の下の議論を参照していると思います。これらは興味深い点ですが、これが明確な答えを与えるとは思いません。Liu et al。による論文は間違いない。究極の答えではありませんが、たとえば、ベースライン値の非正規性は重要な問題ではないことを示唆しています。これは、OPの質問に直接関係しないため、別のディスカッションアイテムの場合があります。
ヴォルフガング

2
はい、それは非正規性の量に依存します。モデルを定式化するときに幸運に依存するのはなぜですか?タイムゼロの測定値をベースライン測定値として扱う純粋に哲学的な理由も数多くあります(私のメモのSennとRochonからの引用を参照)。
フランクハレル

19

モデルで主な効果を維持する理由は、識別可能性のためです。したがって、目的が各効果に関する統計的推論である場合、モデル内の主な効果を維持する必要があります。ただし、モデリングの目的が新しい値の予測のみである場合、予測精度が向上する場合は相互作用のみを含めることは完全に合法です。


5
識別可能性の問題について、もう少し明確にしてください。
ocram

6
主効果を省いたモデルが必ずしも正体不明だとは思わない。おそらく、あなたは「解釈可能」ではなく(正確な定義と専門用語である)「識別性」を意味する
JMS

6
@JMS:はい、それは解釈可能性を殺します。ただし、「識別可能性」という用語は、統計学者と社会科学者によって異なる方法で使用されます。私は後者を意味しました。(大まかに言って)特定の構造を持つ各統計パラメーターを識別したい場合。主効果をドロップすることにより、コンストラクトをパラメーターに一致させることができなくなります。
ガリットシュムエリ

13

これは、他の人が出した回答の多くで暗示されていますが、単純な点は、モデルは積項であるが、モデレーターとプレディクターのw /&w / oは異なるモデルであるということです。把握、各手段はどのようなあなたがモデリングされているプロセスを特定し、モデルW / O司会&予測因子は、あなたの理論や仮説与えられた多くの理にかなっているかどうか。積項が重要であることが、司会&予測因子が含まれていない場合にのみ観察は、あなたのワット/ OA説得力のある説明(多分あなたは「意義」のために周りの釣りしていることを除いて)何も教えてくれない理由、それはそれらを残すために理にかなっていると。


重要な相互作用用語が存在する場合の主な効果の解釈を調査するためにここに来ましたが、この答えは非常に役立ちました。ありがとう!
パトリックウィリアムズ

9

おそらく、それはあなたがあなたのモデルを使用しているものに依存します。しかし、仮説が相互作用のみに関する場合でも、主効果のあるモデルを実行および記述しない理由は見たことがありません。


主効果がモデルにない場合にのみ相互作用が重要な場合はどうなりますか?
グレン

3
@Glen-統計的有意性以外にも考えるべきことがたくさんあります。参照してくださいこれを。モデル全体の適合(適合した各モデルの予測に対する残差のプロット)、理論、およびモデリングの動機を調べる方が適切です。
マイケルビショップ

7

私は本から段落を借りますStataのを使用して生存分析に導入することによりM.Cleves、R.Gutierrez、W.Gould、Y.Marchenkoで編集Stataのプレスあなたの質問に答えるために。

相互作用効果は、対応する主効果も含まれている場合にのみモデルに含める必要があると読むのが一般的ですが、相互作用効果を単独で含めることには何の問題もありません。[...]研究者の目標は、単に処方箋に従うだけではなく、目前の問題を考慮して、データに当てはまる可能性が合理的に高いと思われるものをパラメータ化することです。


3
絶対に恐ろしいアドバイス。
フランクハレル

3
@フランク、あなたのコメントを拡大してくれませんか?一見すると、「データに当てはまる可能性が合理的に高いものをパラメーター化する」ことは非常に理にかなっています。
whuber

6
stats.stackexchange.com/questions/11009/…を参照してください。データは真実を伝えることができず、そのようなアプローチは乗算される変数の測定元に大きく依存します。華氏の温度の孤立した相互作用効果を評価すると、摂氏を使用した場合とは異なる状況が得られます。
フランクハレル

@フランク:ありがとう、私はそれを見つけた:-)。現在、このスレッドの一部です。
whuber

7

xyは両方ともxyと相関します(センタリングを使用してこれを防ぐための特定の手段を講じていない限り)。したがって、アプローチで実質的な相互作用効果が得られた場合、相互作用を装った1つ以上の主な効果になります。これにより、明確で解釈可能な結果が得られません。望ましいのは、xy、および(好ましくは後続のステップで)xyを含めることにより、主な効果が何を行うかを超えて相互作用がどの程度説明できるかを確認することです。

用語に関して:はい、β0は「定数」と呼ばれます。一方、「部分的」には回帰において特定の意味があるため、ここではその用語を使用して戦略を説明しません。

ブルームーンに一度現れるいくつかの興味深い例がこのスレッドで説明されています


7

これは、単にモデルの不確実性の特殊なケースであることをお勧めします。ベイジアンの観点からは、次のいずれかの方法で、他の種類の不確実性を扱うのとまったく同じ方法でこれを処理します。

  1. 関心の対象である場合の確率の計算
  2. 興味の対象ではないが、結論に影響を及ぼす可能性がある場合は、統合または平均化する

HntAとBの相互作用は重要です
D
PHnt|D=PHnt|PD|HntPD|
PD|Hnt
PD|Hnt=m=1NMPDMm|Hnt=m=1NMPMm|HntPD|MmHnt
MmNM
PHnt|D=PHnt|PD|m=1NMPMm|HntPD|MmHnt
=1PD|m=1NMPDMm|PMmHntD|PDMm|=m=1NMPMm|DPHnt|DMm

PHnt|DMmPMm|D1PHnt|DMjPHnt|DMk


5

主な効果を伴わない相互作用用語を含めることはめったにありません。CCNYのDavid Rindskopfは、これらのまれな事例についていくつかの論文を書いています。


5

自然界には、相互作用効果とそれを説明する法律のみを含むさまざまなプロセスがあります。たとえば、オームの法則。心理学では、たとえば、Vroom(1964)のパフォーマンスモデルがあります:パフォーマンス=能力x動機付け。今、この法則が当てはまる場合、重要な相互作用効果を見つけることが期待できます。残念ながら、そうではありません。2つの主な効果と取るに足らない相互作用効果を簡単に見つけることができます(デモンストレーションと詳細な説明については、Landsheer、van den WittenboerおよびMaassen(2006)、Social Science Research 35、274-294を参照してください)。線形モデルは、相互作用効果の検出にはあまり適していません。オームは、線形モデルを使用していたときに彼の法則を見つけたことがなかったかもしれません。

その結果、線形モデルでの相互作用効果の解釈は困難です。相互作用効果を予測する理論がある場合は、重要でない場合でもそれを含める必要があります。あなたの理論がそれらを除外する場合、主効果を無視したいかもしれませんが、乗算効果のみを持つ真のデータ生成メカニズムの場合に重要な主効果がしばしば見られるので、あなたはそれを難し​​く感じるでしょう。

私の答えは次のとおりです。はい、主効果を含めずに双方向の相互作用をモデルに含めることは有効です。線形モデルは、さまざまなデータ生成メカニズムの結果を近似する優れたツールですが、その式は、データ生成メカニズムの有効な説明として簡単に解釈することはできません。


4

これはトリッキーで、私の最後のプロジェクトで私に起こりました。このように説明します。変数AとBが独立して重要であり、ビジネスの感覚からすると、AとBの相互作用は良いようだと考えたとしましょう。重要であると判明した相互作用を含めましたが、Bはその重要性を失いました。最初に2つの結果を表示して、モデルを説明します。結果は、最初はBが有意であったが、Aに照らして見ると光沢が失われたことを示します。したがって、Bは適切な変数ですが、Aのさまざまなレベルに照らして見た場合のみです(Aがカテゴリ変数の場合)。そのようなオバマは、そのシール軍の光で見たときに良い指導者であると言っています。したがって、Obama * sealは重要な変数になります。しかし、オバマは一人で見たときほど重要ではないかもしれません。(オバマへの違反はありません、単なる例です。)


1
ここでは反対のようなものです。(対象の)相互作用は、主効果がモデル内にない場合にのみ重要です。
グレン

3

F = m * a、力は質量と加速度の積に等しい。

F = m + a + ma、またはこれらのパラメーターの他の線形結合として表されません。実際、質量と加速度の相互作用のみが物理的に意味をなします。


2
変動の余地がない議論の余地のない物理方程式に適用されるものは、変動によって特徴付けられるデータをモデル化するときに必ずしも当てはまらないか、必ずしも真または正確または生産的ではありません。
rolando2

2

主効果がある場合とない場合の相互作用。 青は1つの条件です。 別の赤。 それぞれの効果は、3回連続して測定されます。

主効果のない双方向の相互作用を含めることは有効ですか?

はい、それは有効であり、必要な場合もあります。たとえば2.で主効果の要因(青と赤の条件の平均差)を含めると、モデルが悪化します。

仮説が相互作用のみに関するものである場合、主効果を含める必要がありますか?

あなたの仮説は、主効果があるとは無関係に真であるかもしれません。しかし、モデルは、基礎となるプロセスを最もよく説明するために必要になる場合があります。そうです、ありとなしで試してみてください。

注:「連続」独立変数のコードを中央に配置する必要があります(この例では測定)。そうしないと、モデル内の相互作用係数は対称的に分布しません(例の最初の測定の係数はありません)。


1

問題の変数がカテゴリカルである場合、主効果のない相互作用を含めることはモデルの再パラメーター化にすぎず、パラメーター化の選択はモデルで達成しようとしていることに依存します。連続変数と他の連続変数、またはカテゴリ変数との相互作用はまったく別の話です。参照:UCLAのデジタル研究教育研究所のこの FAQをご覧ください


1

はい、これは有効ですが、まれです。ただし、この場合でも、主な効果をモデル化する必要があります。これは後で回帰します。

実際、一部のモデルでは、薬物検査/臨床モデルなどの相互作用のみが興味深いものです。これは、たとえば、一般化された心理生理学的相互作用(gPPI)モデルの基礎です。ボクセル/関心領域はy = ax + bxh + chどこにx/yあり、hブロック/イベント設計ますか。

このモデルではacとの両方が回帰され、b推論(ベータ係数)のみが保持されます。実際、両方のaおよびcは、私たちの場合の偽の活動を表し、偽の活動b、タスクとの相互作用によって説明できないものだけを表します。


1

簡単な答え:固定効果に相互作用を含めると、コードに具体的に含めるかどうかにかかわらず、主効果が自動的に含ま れます。唯一の違いはパラメーター化、つまり、モデルのパラメーターの意味です(たとえば、グループ平均であるか、参照レベルとの違いであるか)。

ABA+B+ABAB

YNξσ2nバツAバツBバツABξ{バツAバツBバツAB}ξ{バツAB}{バツAB}={バツAバツBバツAB}

David Beedeが非常によく似た答え(謝罪)を提供しているのを見ましたが、線形代数の観点によく反応する人にはこれを任せると思いました。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.