バイナリの結果と予測子でロジスティック回帰を使用するのは理にかなっていますか?


18

バイナリの結果変数{0,1}と予測変数{0,1}があります。私の考えでは、他の変数を含めてオッズ比を計算しない限り、ロジスティックを行うのは理にかなっていません。

1つのバイナリ予測子では、確率の計算はオッズ比に対して十分ではないでしょうか?

回答:


26

このケースでは、にデータを縮小することができる S I jはのためのインスタンスの数であるX = IかつY = JI J { 0 1 }。全体でn個の観測があると仮定します。

バツY010S00S011S10S11
Sjバツ=y=jj{01}n

私たちがモデルにフィットした場合(ここで、gは、当社のリンク機能である)我々は見つけるβに 0です成功の割合のロジットは場合xはiが = 0及びβ 0 + β 1が成功するときの割合のロジットありますp=g1バツTβ=g1β0+β11バツ=1gβ^0バツ=0β^0+β^1。換言すれば β 0 = G S 01バツ=1 及び β 0+ β 1=GS11

β^0=gS01S00+S01
β^0+β^1=gS11S10+S11

これを確認してみましょうR

n <- 54
set.seed(123)
x <- rbinom(n, 1, .4)
y <- rbinom(n, 1, .6)

tbl <- table(x=x,y=y)

mod <- glm(y ~ x, family=binomial())

# all the same at 0.5757576
binomial()$linkinv( mod$coef[1])
mean(y[x == 0])
tbl[1,2] / sum(tbl[1,])

# all the same at 0.5714286
binomial()$linkinv( mod$coef[1] + mod$coef[2])
mean(y[x == 1])
tbl[2,2] / sum(tbl[2,])

したがって、ロジスティック回帰係数は、テーブルから得られる比率の正確な変換です。

結果は、一連のベルヌーイ確率変数からのデータがある場合、ロジスティック回帰を使用してこのデータセットを確実に分析できることですが、結果の分割表を直接分析することと違いはありません。


Y|バツベルンpバツp=g1β0+β1バツバツpp0p1

バツ=0Y=S01置き場n0p0
バツ=1Y=S11置き場n1p1
バツn0n1

S01/n0=S01S00+S01pp0 そして S11/n1=S11S10+S11pp1

Y|バツ=jベルンpjSj1置き場njpj


1

複数の予測変数があり、すべての予測変数がバイナリ変数である場合、ロジック回帰[1]を使用してモデルを近似できます(「ロジスティック」ではなく「ロジック」です)。予測子間の相互作用効果が顕著であると思われる場合に役立ちます。R(LogicRegパッケージ)に実装があります。

[1] Ruczinski、I.、Kooperberg、C.&LeBlanc、M.(2003)。論理回帰。Journal of Computational and Graphic Statistics、12(3)、475-511。


1
質問は具体的には1人のリグレッサーに関するものであるため、回答はコメントとして使用した方が良いでしょう。
リチャードハーディ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.