対数オフセットのあるバイナリモデル（プロビットおよびロジット）

プロビットやロジットなどのバイナリモデルでオフセットがどのように機能するのか、誰からも導出されていますか？

私の問題では、フォローアップウィンドウの長さが異なる場合があります。患者が治療として予防注射を受けたとします。ショットはさまざまなタイミングで発生するため、結果がフレアアップが発生したかどうかのバイナリインジケータである場合、一部の人々が症状を示す時間があることを調整する必要があります。フレアアップの確率は、フォローアップ期間の長さに比例するようです。（ポアソンとは異なり）オフセットのあるバイナリモデルがこの直感をどのようにキャプチャするかは、数学的には明確ではありません。

オフセットは、Stata（p.1666）とRの両方の標準オプションであり、ポアソンについては簡単に確認できますが、バイナリの場合は少し不透明です。

たとえば、これは代数的にモデルと同等です。は、係数が制限された標準モデルです。これは対数オフセットと呼ばれます。をまたはに置き換えた場合、これがどのように機能するかを理解するのに苦労しています。

\frac{E [y | バツ]}{Z} = \exp {{バツ}^{'} β} 、

$\begin{equation} \frac{E[y \vert x]}{Z}=\exp\{x'\beta\}, \end{equation}$

E [y | バツ] = \exp {{バツ}^{'} β + ログ Z} 、

$\begin{equation}E[y \vert x]=\exp\{x'\beta+\log{Z}\}, \end{equation}$

\log Z

$\log Z$

1

$1$

\exp {}

$\exp\{\}$

Φ ()

$\Phi()$

Λ ()

$\Lambda()$

アップデート＃1：

以下にロジットのケースについて説明しました。

アップデート＃2：

ここでは、プロビットのような非ポアソンモデルのオフセットの主な使用方法と思われるものについて説明します。オフセットを使用して、インデックス関数係数の尤度比テストを実行できます。まず、制約のないモデルを推定し、推定を保存します。という仮説をテストするとします。次に、変数を作成し、をドロップし、を非対数オフセットとして使用するモデルに適合します。これが制約モデルです。LRテストは2つを比較し、通常のWaldテストの代替です。 $\beta_x=2$ $z=2 \cdot x$ $x$ $z$

— ディミトリイ・V・マスタロフ
ソース

回答:

GLMにはいつでもオフセットを含めることができます。これは、係数が1に固定された単なる予測変数です。ポアソン回帰は、たまたま非常に一般的な使用例です。

二項モデルでは、オフセットとしての対数露光との類似は単なる二項分母であるため、通常は明示的に指定する必要はありません。ポアソンRVをオフセットとしての対数露光のあるカウントとして、または重みとしての露光のある比率としてモデル化できるのと同様に、同様に成功と失敗のカウントとして、または次のような試行の頻度として二項RVをモデル化できます重さ。

ロジスティック回帰では、解釈するが比例して変化：オッズ比の面でオフセット内の指定された比例変化をもたらす。 $\log Z$ $Z$ $p/(1-p)$

\begin{aligned} \log (p / (1 - p)) & = β^{'} X + \log Z \\ p / (1 - p) & = Z \exp (β^{'} X) \end{aligned}

$\begin{equation}\begin{split} \log (p/(1-p)) &= \beta' \mathrm{X} + \log Z \\ p/(1-p) &= Z \exp(\beta' \mathrm{X}) \end{split}\end{equation}$

しかし、これは、ポアソン回帰での対数露光のような特別な意味を持ちません。ただし、二項確率が十分に小さい場合、ロジスティックモデルは（LHSの分母が1に近づくため）ログリンクを使用してポアソンモデルに近づき、オフセットは対数露光項として扱うことができます。

（リンクされたRの質問で説明されている問題は、かなり特異です。）

— 大井紅
ソース

重みの部分は、2つの等価性に関する私の理解から欠落していました。それはとても役に立ちました。のようなものを、フレアアップの確率に比例するステートメントに変換する方法については、まだ少し混乱しています。フォローアップ期間の長さ、私はそれがどのように見ることができますが増加して。

Pr (Y = 1 | X) = Φ (x^{'} β + \ln (t))

$\Pr(Y=1 \vert X)=\Phi(x'\beta+\ln(t))$

t

$t$

t

$t$

— Dimitriy V. Masterov

それは確率ではなく、オッズ比です。編集がより明確になることを願っています。

— 大井紅

オッズ比の観点から問題を表現すると、非常に明確になります。プロビットはどうですか？

— Dimitriy V. Masterov

は正規のリンクではなく、プロビットのバイナリ依存変数は指数ファミリーに該当しないため、プロビットで動作すること、または少なくともクリーンな解釈ができることは期待しません。

Φ (\cdot)

$\Phi(\cdot)$

— StasK

@StasKそれは正しいようですが、なぜこれらのオプションがStataとRに存在するのですか？彼らは何を達成しますか？

— Dimitriy V. Masterov

これをイベント発生までの時間の問題として再キャストすると、ln（time）オフセットのあるロジスティックモデルは、データにうまく適合する場合とそうでない場合があるパラメトリック生存関数に効果的にコミットしませんか？

p /（1-p）= Z * exp（xbeta）

p = [Z * exp（xbeta）] / [1 + Z * exp（xbeta）]

時間Zでの予測生存時間= 1- [Z * exp（xbeta）] / [1 + Z * exp（xbeta）]

— エリック
ソース