バイナリ従属変数および独立変数を使用したロジスティック回帰


14

従属変数と独立変数の両方がバイナリであるロジスティック回帰を行うことは適切ですか?たとえば、従属変数は0と1であり、予測変数はコントラストコード化された変数-1と1です。

回答:


6

これをしない理由はありませんが、2つの注意事項があります。

  1. どちらを分析するかを慎重に追跡してください。大規模なプロジェクトでは、簡単に迷子になり、誤った結果が生じる可能性があります。

  2. オッズ比ではなく回帰推定値を報告することを選択した場合、レポートでコーディングスキームを明確にし、読者が両方とも0,1でコーディングされていると仮定して、不正確なORを自分で生成しないようにします

基本的なように見えるかもしれませんが、両方の問題が出版された論文になっているのを見ました。


それで、データファイルを6つの別々のケースに分けて、各データセット内でconstastコードされた予測子で個別の比較を実行することも適切でしょうか?
11

正直、この2番目のビットについて何を求めているのかわかりません。達成したいことを明確にできますか?
フォマイト

対象条件内に3〜4のデータセットがあります。すべての効果をテストしたいのですが、すべての相互作用を伴う単一の回帰では、興味のある多くの情報が失われます。興味のある違いをコード化するコード。
11

私はコーディング方法についても、詳細はコントラストコードはこちらをご覧ください:stats.stackexchange.com/questions/14546/...
upabove

11

わかりやすくするために、「バイナリ」という用語は通常、1対0のコーディングのみに予約されています。2値コーディングに適したより一般的な単語は「二分法」です。もちろん、二項予測子は線形回帰と同様にロジスティック回帰に歓迎されます。また、2つの値しか持たないため、因子として入力するか共変量として入力するかに違いはありません。


5

通常、予測子を0〜1にコーディングすると解釈に役立ちますが、それ以外は(また、必須ではないことに注意してください)、これには何の問題もありません。他の(コンティンジェンシーテーブルベースの)アプローチがいくつかありますが、正しく思い出せば、これらは(何らかの形の)ロジスティック回帰と同等であることがわかります。

要するに、これをしない理由はないと思います。


ありがとう!そして、コントラストコーディングされた予測子が3つあり、それらすべてを0-1でコーディングすると、直交しなくなります。たとえば、4つのカテゴリがあり、3つのコードはL1:1、-1,0,0 L2:0,1、-1,0、L3:0,0,1、-1です。それは問題ですか?
upabove

Lマトリックス(L1、L2、L3)の例は、各カテゴリが次のカテゴリと比較される繰り返しコントラストです。これらのコントラスト予測子は直交的でもバイナリーでもありません(0-1としてコード化)。実際、それらの値は.75 vs -.25(1番目の変数)、. 5 vs -.5(2番目の変数)、. 25 vs-.. 75(3番目の変数)
ttnphns

3

さらに、予測子が3つ以上ある場合、ロジスティック回帰または重回帰の場合でも、多重共線性の問題が発生する可能性が高くなります。ただし、すべてのバイナリ変数でロジスティック回帰を使用しても害はありません(つまり、コード化(0,1))。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.