オッズはチャンスを表現する方法です。 オッズ比は、1つのオッズを別のオッズで割ったものです。 つまり、オッズ比とは、オッズを掛けて別のオッズを生成することです。この一般的な状況でどのように機能するかを見てみましょう。
オッズと確率の間の変換
バイナリ応答のオッズは、で記述された発生確率(コーディング)と)で記述された発生確率(コーディング)の比率です:Y1Pr(Y=1)0Pr(Y=0)
Odds(Y)=Pr(Y=1)Pr(Y=0)=Pr(Y=1)1−Pr(Y=1).
右側の同等の式は、オッズを見つけるためにをモデル化すれば十分であることを示しています。逆に、解決できることに注意してくださいPr(Y=1)
Pr(Y=1)=Odds(Y)1+Odds(Y)=1−11+Odds(Y).
ロジスティック回帰
ロジスティック回帰は、説明変数の線形関数としてのオッズの対数をモデル化します。最も一般的には、これらの変数をとして記述し、線形関数に可能な定数項を含めて、係数(データから推定される)におよび。正式にこれはモデルを生成しますYx1,…,xpβ1,…,βpβ0
log(Odds(Y))=β0+β1x1+⋯+βpxp.
オッズ自体は、対数を元に戻すことで回復できます。
Odds(Y)=exp(β0+β1x1+⋯+βpxp).
カテゴリー変数の使用
そのような年齢層、性別、緑内障の存在、などカテゴリ変数、などの手段により組み込まれている「コーディングダミー。」変数のコーディング方法は重要ではないことを示すために、1つの小さなグループの簡単な例を示します。複数のグループへの一般化は明らかです。この研究では、1つの変数は「瞳孔サイズ」であり、「大」、「中」、「小」の3つのカテゴリがあります。(どうやらその固有の順序に注意を払っていない純粋なカテゴリとして研究を扱い、これらは、。)直感的には、各カテゴリには独自のオッズを持っている、と言う、「大」のために「中」のため、および「小」のために。これは、他のすべてのものが等しいことを意味し、αLαMαS
Odds(Y)=exp(αL+β0+β1x1+⋯+βpxp)
「大」カテゴリの人には
Odds(Y)=exp(αM+β0+β1x1+⋯+βpxp)
「中」カテゴリのすべての人、および
Odds(Y)=exp(αS+β0+β1x1+⋯+βpxp)
「小」カテゴリの人向け。
識別可能な係数の作成
最初の2つの係数に色を付けて強調表示しています。単純な変更ができることに注意してください。任意の数のを選択し、追加して各から減算することで、および、予測オッズは変更しません。 これは、次の形式の明らかな等価性のためです。γβ0αLαMαS
αL+β0=(αL−γ)+(γ+β0),
など。 これはモデルに問題を引き起こしませんが、それでもまったく同じことを予測しますが、パラメーター自体が解釈可能でないことを示しています。この加減操作を行っても変わらないのは、係数の違いです。従来、この識別可能性の欠如に対処するために、人々(およびデフォルトではソフトウェア)は、各変数のカテゴリーの1つを「ベース」または「参照」として選択し、その係数がゼロになることを単純に規定します。これにより、あいまいさがなくなります。
このペーパーでは、最初に参照カテゴリーをリストしています。この場合は「大」。したがって、は、およびそれぞれから減算され、補償するためにに追加されます。αLαL,αM,αSβ0
したがって、すべての基本カテゴリに分類される仮想個人の対数オッズは、に、他のすべての「共変量」に関連付けられたの用語(非カテゴリ変数)を加えたものに等しくなります。β0
Odds(Base category)=exp(β0+β1X1+⋯+βpXp).
カテゴリ変数に関連する用語はここには表示されません。(この時点で表記を少し変更しました:ベータは共変量の係数のみになりましたが、完全なモデルにはさまざまなカテゴリのアルファ含まれています。)βiαj
オッズの比較
オッズを比較しましょう。仮想の個人が
80〜89歳の男性患者で、白内障があり、眼底に見えず、小さな生徒が専門のレジストラによって手術を受けている、...
この患者(Charlieと呼ぶ)にられているのは、各カテゴリの推定係数です:年齢層の、です。彼の属性がそのカテゴリのベースである場合は、これまで見てきたように、係数は慣例によりゼロです。これは線形モデルであるため、係数が追加されます。 したがって、上記の対数オッズに、この患者の対数オッズは、α80-89αmale
α80-89+αmale+αno Glaucoma+⋯+αspecialist registrar.
これは、正確にこの患者の対数オッズがベースと異なる量です。対数オッズから変換するには、対数を元に戻し、これにより加算が乗算に変わることを思い出してください。したがって、ベースオッズに乗算する必要があります
exp(α80-89)exp(αmale)exp(αno Glaucoma)⋯exp(αspecialist registrar).
これらは「調整済みOR」(調整済みオッズ比)の下の表に示されている数値です。(共変量がモデルに含まれていたため、「調整済み」と呼ばれます。これはするように、いずれの計算でも役割を果たしません。患者の予測オッズを生成するためにベースオッズを乗算する必要があります。この投稿の最初の段落を参照してください。)テーブル内の順序は、、、など。記事によると、彼らの製品はます。だからx1,…,xpexp(α80-89)=1.58exp(αmale)=1.28exp(αno Glaucoma)=1.0034.5
Odds(Charlie)=34.5×Odds(Base).
(基本カテゴリのオッズ比はすべてであることに注意してください。製品にを含めると変更されないため、表で基本カテゴリを見つけることができます。) 1.00=exp(0)1
結果を確率として書き直す
最後に、この結果を確率に変換しましょう。ベースラインの予測確率は。したがって、最初に導出されたオッズと確率に関する式を使用して、0.736%=0.00736
Odds(Base)=0.007361−0.00736=0.00741.
その結果、チャーリーのオッズは
Odds(Charlie)=34.5×0.00741=0.256.
最後に、これを確率に戻すと、
Pr(Y(Charlie)=1)=1−11+0.256=0.204.