ロジスティック回帰の調整済みオッズ比を理解するのに役立ちます

私は論文でロジスティック回帰の使用を理解しようとして苦労してきました。ここで利用可能な論文は、白内障手術中の合併症の確率を予測するためにロジスティック回帰を使用しています。

私を混乱させているのは、以下のように説明されているベースラインにオッズ比1を割り当てるモデルを示していることです。

リスクプロファイルがすべてのリスクインジケータの参照グループに含まれていた患者（つまり、表1のすべてについて調整されたOR = 1.00）は、「ベースラインリスクプロファイル」を持っていると見なされ、ロジスティック回帰モデルは「ベースライン予測確率」を示しますPCRまたはVLまたは両方= 0.736％の場合。

そのため、0.00736の確率は1のオッズ比で表されます。確率からオッズ比への変換に基づいて：、これは1：。 $o=\frac{p}{1-p}$ $0.00741=\frac{0.00736}{1-0.00736}$

さらに複雑になります。ベースラインとは異なる値を持つ複数の共変量を表す複合オッズ比を使用して、予測リスクを計算します。

...表1の合成ORは1.28 X 1.58 X 2.99 X 2.46 X 1.45 X 1.60 = 34.5であり、図1のグラフから、このORはPCRまたはVLまたはその両方の予測確率に対応することがわかります約20％

論文が例として示している値に到達する唯一の方法は、ベースラインの確率に次のような複合オッズを掛けることです：。 $0.2025=\frac{(34.50\ \times\ 0.00736)}{1\ +\ (34.50\ \times\ 0.00736)}$

ここで何が起こっているのでしょうか？0.5ではないベースライン確率にオッズ比1を割り当てるためのロジックは何ですか？私が上で思いついた更新式は、論文の例にふさわしい確率を考え出しますが、これは私が期待するオッズ比の直接的な乗算ではありません。それは何ですか？

logistic odds-ratio

— まほにゃ
ソース

用語について単純な混乱があるかもしれません：はオッズであり、オッズ比ではありません。オッズ比は、そのような式を別の式で除算したものです。

p / (1 - p)

$p/(1-p)$

— whuber

オッズはチャンスを表現する方法です。 オッズ比は、1つのオッズを別のオッズで割ったものです。つまり、オッズ比とは、オッズを掛けて別のオッズを生成することです。この一般的な状況でどのように機能するかを見てみましょう。

オッズと確率の間の変換

バイナリ応答のオッズは、で記述された発生確率（コーディング）と）で記述された発生確率（コーディング）の比率です： $Y$ $1$ $\Pr(Y=1)$ $0$ $\Pr(Y=0)$

Odds (Y) = \frac{Pr (Y = 1)}{Pr (Y = 0)} = \frac{Pr (Y = 1)}{1 - Pr (Y = 1)} .

$\text{Odds}(Y) = \frac{\Pr(Y=1)}{\Pr(Y=0)} = \frac{\Pr(Y=1)}{1 - \Pr(Y=1)}.$

右側の同等の式は、オッズを見つけるためにをモデル化すれば十分であることを示しています。逆に、解決できることに注意してください $\Pr(Y=1)$

Pr (Y = 1) = \frac{Odds (Y)}{1 + Odds (Y)} = 1 - \frac{1}{1 + Odds (Y)} .

$\Pr(Y=1) = \frac{\text{Odds}(Y)}{1 + \text{Odds}(Y)} = 1 - \frac{1}{1 + \text{Odds}(Y)}.$

ロジスティック回帰

ロジスティック回帰は、説明変数の線形関数としてのオッズの対数をモデル化します。最も一般的には、これらの変数をとして記述し、線形関数に可能な定数項を含めて、係数（データから推定される）におよび。正式にこれはモデルを生成します $Y$ $x_1, \ldots, x_p$ $\beta_1,\ldots, \beta_p$ $\beta_0$

\log (Odds (Y)) = β_{0} + β_{1} x_{1} + \dots + β_{p} x_{p} .

$\log\left(\text{Odds}(Y)\right) = \beta_0 + \beta_1 x_1 + \cdots + \beta_p x_p.$

オッズ自体は、対数を元に戻すことで回復できます。

Odds (Y) = \exp (β_{0} + β_{1} x_{1} + \dots + β_{p} x_{p}) .

$\text{Odds}(Y) = \exp(\beta_0 + \beta_1 x_1 + \cdots + \beta_p x_p).$

カテゴリー変数の使用

そのような年齢層、性別、緑内障の存在、などカテゴリ変数、などの手段により組み込まれている「コーディングダミー。」変数のコーディング方法は重要ではないことを示すために、1つの小さなグループの簡単な例を示します。複数のグループへの一般化は明らかです。この研究では、1つの変数は「瞳孔サイズ」であり、「大」、「中」、「小」の3つのカテゴリがあります。（どうやらその固有の順序に注意を払っていない純粋なカテゴリとして研究を扱い、これらは、。）直感的には、各カテゴリには独自のオッズを持っている、と言う、「大」のために「中」のため、および「小」のために。これは、他のすべてのものが等しいことを意味し、 $\alpha_L$ $\alpha_M$ $\alpha_S$

Odds (Y) = \exp (α_{L} + β_{0} + β_{1} x_{1} + \dots + β_{p} x_{p})

$\text{Odds}(Y) = \exp(\color{Blue}{\alpha_L + \beta_0} + \beta_1 x_1 + \cdots + \beta_p x_p)$

「大」カテゴリの人には

Odds (Y) = \exp (α_{M} + β_{0} + β_{1} x_{1} + \dots + β_{p} x_{p})

$\text{Odds}(Y) = \exp(\color{Blue}{\alpha_M + \beta_0} + \beta_1 x_1 + \cdots + \beta_p x_p)$

「中」カテゴリのすべての人、および

Odds (Y) = \exp (α_{S} + β_{0} + β_{1} x_{1} + \dots + β_{p} x_{p})

$\text{Odds}(Y) = \exp(\color{Blue}{\alpha_S + \beta_0} + \beta_1 x_1 + \cdots + \beta_p x_p)$

「小」カテゴリの人向け。

識別可能な係数の作成

最初の2つの係数に色を付けて強調表示しています。単純な変更ができることに注意してください。任意の数のを選択し、追加して各から減算することで、および、予測オッズは変更しません。 これは、次の形式の明らかな等価性のためです。 $\gamma$ $\beta_0$ $\alpha_L$ $\alpha_M$ $\alpha_S$

α_{L} + β_{0} = (α_{L} - γ) + (γ + β_{0}),

$\alpha_L + \beta_0 = (\alpha_L - \gamma) + (\gamma + \beta_0 ),$

など。 これはモデルに問題を引き起こしませんが、それでもまったく同じことを予測しますが、パラメーター自体が解釈可能でないことを示しています。この加減操作を行っても変わらないのは、係数の違いです。従来、この識別可能性の欠如に対処するために、人々（およびデフォルトではソフトウェア）は、各変数のカテゴリーの1つを「ベース」または「参照」として選択し、その係数がゼロになることを単純に規定します。これにより、あいまいさがなくなります。

このペーパーでは、最初に参照カテゴリーをリストしています。この場合は「大」。したがって、は、およびそれぞれから減算され、補償するためにに追加されます。 $\alpha_L$ $\alpha_L, \alpha_M,$ $\alpha_S$ $\beta_0$

したがって、すべての基本カテゴリに分類される仮想個人の対数オッズは、に、他のすべての「共変量」に関連付けられたの用語（非カテゴリ変数）を加えたものに等しくなります。 $\beta_0$

Odds(Base category) = \exp (β_{0} + β_{1} X_{1} + \dots + β_{p} X_{p}) .

$\text{Odds(Base category)} = \exp(\beta_0 + \beta_1X_1 + \cdots + \beta_p X_p).$

カテゴリ変数に関連する用語はここには表示されません。（この時点で表記を少し変更しました：ベータは共変量の係数のみになりましたが、完全なモデルにはさまざまなカテゴリのアルファ含まれています。） $\beta_i$ $\alpha_j$

オッズの比較

オッズを比較しましょう。仮想の個人が

80〜89歳の男性患者で、白内障があり、眼底に見えず、小さな生徒が専門のレジストラによって手術を受けている、...

この患者（Charlieと呼ぶ）にられているのは、各カテゴリの推定係数です：年齢層の、です。彼の属性がそのカテゴリのベースである場合は、これまで見てきたように、係数は慣例によりゼロです。これは線形モデルであるため、係数が追加されます。 したがって、上記の対数オッズに、この患者の対数オッズは、 $\alpha_\text{80-89}$ $\alpha_\text{male}$

α_{80-89} + α_{male} + α_{no Glaucoma} + \dots + α_{specialist registrar} .

$\alpha_\text{80-89}+\alpha_\text{male}+\alpha_\text{no Glaucoma}+ \cdots + \alpha_\text{specialist registrar}.$

これは、正確にこの患者の対数オッズがベースと異なる量です。対数オッズから変換するには、対数を元に戻し、これにより加算が乗算に変わることを思い出してください。したがって、ベースオッズに乗算する必要があります

\exp (α_{80-89}) \exp (α_{male}) \exp (α_{no Glaucoma}) \dots \exp (α_{specialist registrar}) .

$\exp(\alpha_\text{80-89})\exp(\alpha_\text{male})\exp(\alpha_\text{no Glaucoma}) \cdots \exp(\alpha_\text{specialist registrar}).$

これらは「調整済みOR」（調整済みオッズ比）の下の表に示されている数値です。（共変量がモデルに含まれていたため、「調整済み」と呼ばれます。これはするように、いずれの計算でも役割を果たしません。患者の予測オッズを生成するためにベースオッズを乗算する必要があります。この投稿の最初の段落を参照してください。）テーブル内の順序は、、、など。記事によると、彼らの製品はます。だから $x_1, \ldots, x_p$ $\exp(\alpha_\text{80-89})=1.58$ $\exp(\alpha_\text{male})=1.28$ $\exp(\alpha_\text{no Glaucoma})=1.00$ $34.5$

Odds(Charlie) = 34.5 \times Odds(Base) .

$\text{Odds(Charlie)} = 34.5\times \text{Odds(Base)}.$

（基本カテゴリのオッズ比はすべてであることに注意してください。製品にを含めると変更されないため、表で基本カテゴリを見つけることができます。） $1.00=\exp(0)$ $1$

結果を確率として書き直す

最後に、この結果を確率に変換しましょう。ベースラインの予測確率は。したがって、最初に導出されたオッズと確率に関する式を使用して、 $0.736\%=0.00736$

Odds(Base) = \frac{0.00736}{1 - 0.00736} = 0.00741.

$\text{Odds(Base)} = \frac{0.00736}{1 - 0.00736} = 0.00741.$

その結果、チャーリーのオッズは

Odds(Charlie) = 34.5 \times 0.00741 = 0.256.

$\text{Odds(Charlie)} = 34.5\times 0.00741 = 0.256.$

最後に、これを確率に戻すと、

Pr (Y (Charlie) = 1) = 1 - \frac{1}{1 + 0.256} = 0.204.

$\Pr(Y(\text{Charlie})=1) = 1 - \frac{1}{1 + 0.256} = 0.204.$

— ウーバー
ソース

whuber：非常に疲れた前日の後、私のコンピューターの前に着いて、あなたからのこの異常な反応を見つけることは、単に素晴らしいです。非常に厳しい状況で私を大いに助けてくれました。どうもありがとう。（どういうわけか@ whuberは表示されません...）

— mahonya