多重ロジスティック回帰で有意な予測子が有意でなくなる


11

2つの別個の(単変量)ロジスティック回帰モデルで変数を分析すると、次の結果が得られます。

Predictor 1:    B= 1.049,    SE=.352,    Exp(B)=2.85,    95% CI=(1.43, 5.69),    p=.003
   Constant:    B=-0.434,    SE=.217,    Exp(B)=0.65,                            p=.046

Predictor 2:    B= 1.379,    SE=.386,    Exp(B)=3.97,    95% CI=(1.86, 8.47),    p<.001
   Constant:    B=-0.447,    SE=.205,    Exp(B)=0.64,                            p=.029

しかし、それらを単一の多重ロジスティック回帰モデルに入力すると、次のようになります。

Predictor 1:    B= 0.556,    SE=.406,    Exp(B)=1.74,    95% CI=(0.79, 3.86),    p=.171
Predictor 2:    B= 1.094,    SE=.436,    Exp(B)=2.99,    95% CI=(1.27, 7.02),    p=.012
   Constant:    B=-0.574,    SE=.227,    Exp(B)=0.56,                            p=.012

両方の予測子は二分です(カテゴリー)。多重共線性をチェックしました。

十分な情報を提供したかどうかはわかりませんが、なぜ予測子1が有意から非有意に変化したのか、またオッズ比が重回帰モデルで大きく異なる理由がわかりません。誰かが起こっていることの基本的な説明を提供できますか?


2
多変量は通常、複数の従属変数を示します-あなたは複数の予測子を意味しましたよね?これは通常、重回帰と呼ばれます。
マクロ

1
β

あぁ、ありがとうございます。spssの線形回帰を通じて共線性診断をチェックし、許容誤差とVIFをチェックしました-これは正しいですか?
Annie

素敵なコメント@Macro。スケールに関するこの問題を修正する方法について読んだことを漠然と思い出しましたが、どこで覚えていません。
ピーターフロム-モニカの回復

1
π2/3

回答:


20

理由はいくつかあります(ロジスティック回帰に特に関連するものはありませんが、どの回帰でも発生する可能性があります)。

  1. 自由度の損失:与えられたデータセットからより多くのパラメーターを推定しようとするとき、あなたは効果的により多くのパラメーターを求めています。
  2. リグレッサの相関関係:リグレッサは互いに関連している可能性があり、類似したものを効果的に測定します。たとえば、ロジットモデルは、労働市場の状況(稼働中/非稼働中)を経験と年齢の関数として説明することです。個々に、両方の変数はステータスに積極的に関連しています。経験豊富/高齢者(議論のために非常に古い従業員を除外する)の従業員は、最近の卒業生よりも仕事を見つけるのが簡単だからです。さて、より多くの経験を積むには年をとる必要があるので、明らかに、2つの変数は強く関連しています。したがって、2つの変数はステータスを説明するために基本的に「競合」します。特に小さなサンプルでは、​​両方の変数が「失われる」可能性があります。重要な見積もり。本質的に、あなたは尋ねています:年齢を一定に保ったときに、もう1年の経験のプラスの効果は何ですか?データセットには、その質問に答える従業員がほとんどいないか、まったくない場合があるため、効果が不正確に推定され、p値が大きくなります。

  3. 誤って指定されたモデル:t統計/ p値の基礎となる理論では、正しく指定されたモデルを推定する必要があります。ここで、1つの予測子のみで回帰する場合、その単変量モデルが省略された変数バイアスの影響を受ける可能性が非常に高くなります。したがって、p値の動作については、すべての賭けがずれています。基本的に、モデルが正しくない場合は、それらを信頼するように注意する必要があります。


迅速かつ迅速に対応していただきありがとうございます。最初に、多重共線性を排除しようとします。私は変数間の相関を実行し、いくつかを発見しました。また、これをチェックするための良い方法だと聞いたので、分散インフレ係数を実行してみます。それが自由度の問題であることが判明した場合、それについて私ができることはありますか?これは起こっていると説明できますが、重要度が大幅に低下すると、回帰の完全性が損なわれるようです。
Sam O'Brien

3
@ SamO'Brien:あなたの目標が実際にあなたが言ったとおりである場合は、「「独立変数が潜在的に応答を引き起こす可能性があるか」を判断しようとすることに注意してください。それを達成するのを助けるために行くのではありません。
Scortchi -復活モニカ

1
それを逆にすることは可能ですか?つまり、単純な回帰では重要ではないが、重回帰では重要な同じ予測子ですか?
gkcn 2017年

8

これが発生してはならない特別な理由はありません。重回帰は、単純回帰とは異なる質問をします。特に、多重回帰(この場合は多重ロジスティック回帰)は、従属変数と独立変数の間の関係について尋ね、他の独立変数を制御します。単純回帰では、従属変数と(単一の)独立変数の関係について尋ねます。

研究のコンテキスト(たとえば、これらの変数は何ですか?)を追加すると、より具体的な応答を提供できる可能性があります。また、あなたのケースの3つの変数すべてが二分であることを考えると、かなり簡単にデータを提示できます...これを要約するのに必要な行は8行だけです。

DVIV1IV2CountAAA10AAB20

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.