その唯一の予測子をモデルに入れるだけの場合、予測子と応答の間のオッズ比は指数回帰係数と正確に等しくなります。この結果の派生はサイトに存在するとは思わないので、この機会に提供します。
バイナリ結果と単一バイナリ予測子考えます。XYバツ
バツ= 1バツ= 0Y= 1p11p01Y= 0p10p00
次に、と間のオッズ比を計算する1つの方法は、Y iバツ私Y私
O R = p11p00p01p10
条件付き確率の定義により、。比率では、を含む限界確率がキャンセルされ、条件付き確率に関してオッズ比を書き換えることができます。p私はj= P(Y= i | バツ= J )⋅ P(X= j )バツY| バツ
O R = P(Y= 1 | バツ= 1 )P(Y= 0 | バツ= 1 )⋅ P(Y= 0 | バツ= 0 )P(Y= 1 | バツ= 0 )
ロジスティック回帰では、これらの確率を直接モデル化します。
log(P(Yi=1|Xi)P(Yi=0|Xi))=β0+β1Xi
したがって、これらの条件付き確率をモデルから直接計算できます。上記の式の最初の比率は次のとおりです。OR
P(Yi=1|Xi=1)P(Yi=0|Xi=1)=(11+e−(β0+β1))(e−(β0+β1)1+e−(β0+β1))=1e−(β0+β1)=e(β0+β1)
そして2番目は:
P(Yi=0|Xi=0)P(Yi=1|Xi=0)=(e−β01+e−β0)(11+e−β0)=e−β0
これを数式に代入すると、結果はになります。OR=e(β0+β1)⋅e−β0=eβ1
注:他の予測子がある場合、それらをと呼びますモデルでは、指数回帰係数(同様の導出を使用)は実際にはZ1,...,Zp
P(Y=1|X=1,Z1,...,Zp)P(Y=0|X=1,Z1,...,Zp)⋅P(Y=0|X=0,Z1,...,Zp)P(Y=1|X=0,Z1,...,Zp)
オッズ比でそのようにモデル内の他の予測変数の値を条件と、一般的に、ではないに等しいです
P(Y=1|X=1)P(Y=0|X=1)⋅P(Y=0|X=0)P(Y=1|X=0)
したがって、指数化された係数と観測されたオッズ比との間の不一致を観測していることは当然のことです。
注2:真の と真のオッズ比の関係を導き出しましたが、単一のバイナリ予測子を使用した近似ロジスティック回帰は2行2列のエントリを正確に再現するため、サンプル量についても同じ関係が成り立つことに注意してくださいテーブル。つまり、フィットされた平均は、他のGLMと同様に、サンプルの平均と正確に一致します。したがって、上記で使用したロジックはすべて、真の値をサンプル量に置き換えて適用されます。 β