回答:
このケースでは、にデータを縮小することができる S I jはのためのインスタンスの数であるX = IかつY = JとI 、J ∈ { 0 、1 }。全体でn個の観測があると仮定します。
私たちがモデルにフィットした場合(ここで、gは、当社のリンク機能である)我々は見つけるβに 0です成功の割合のロジットは場合xはiが = 0及びβ 0 + β 1が成功するときの割合のロジットあります。換言すれば 、β 0 = G (S 01 及び β 0+ β 1=G(S11
これを確認してみましょうR
。
n <- 54
set.seed(123)
x <- rbinom(n, 1, .4)
y <- rbinom(n, 1, .6)
tbl <- table(x=x,y=y)
mod <- glm(y ~ x, family=binomial())
# all the same at 0.5757576
binomial()$linkinv( mod$coef[1])
mean(y[x == 0])
tbl[1,2] / sum(tbl[1,])
# all the same at 0.5714286
binomial()$linkinv( mod$coef[1] + mod$coef[2])
mean(y[x == 1])
tbl[2,2] / sum(tbl[2,])
したがって、ロジスティック回帰係数は、テーブルから得られる比率の正確な変換です。
結果は、一連のベルヌーイ確率変数からのデータがある場合、ロジスティック回帰を使用してこのデータセットを確実に分析できることですが、結果の分割表を直接分析することと違いはありません。
複数の予測変数があり、すべての予測変数がバイナリ変数である場合、ロジック回帰[1]を使用してモデルを近似できます(「ロジスティック」ではなく「ロジック」です)。予測子間の相互作用効果が顕著であると思われる場合に役立ちます。R(LogicReg
パッケージ)に実装があります。
[1] Ruczinski、I.、Kooperberg、C.&LeBlanc、M.(2003)。論理回帰。Journal of Computational and Graphic Statistics、12(3)、475-511。