二項応答によるロジスティック回帰の結果の予測区間


8

ロジスティック回帰モデルがあるとします。

P(y=1|x)=plog(p1p)=βx

サイズNのランダムサンプルD={X,y}を指定すると、\ boldsymbol {\ beta}の信頼区間と、それに対応する特定の値\を指定したpの予測区間を計算できます予測ベクトルのmathbf {x} ^ *。これはすべて非常に標準的で詳細なものです(たとえば、こちら)Nβpx

代わりに、\ mathbf {x} ^ *を指定して、yの予測区間に興味があると仮定します。もちろん、yは値0と1のみをとり、その間に値をとることができないため、yの単一の実現に対する予測区間を計算することはまったく意味がありません。ただし\ mathbf {x} ^ *の同じ固定値に対してyのm実現を考慮すると 、これは二項確率変数の予測区間を計算する問題に似ています(ただし同一ではありません)。これは、基本的にこの回答へのコメントでGlen_bによって説明された同じ状況ですyxyymyx。この質問には、「ノンパラメトリックブートストラップを使用する」というささいな質問とは別に、答えはありますか?


代わりに、おそらくlog(p /(1-p))の予測間隔を計算できますlog(p/(1p))か?
ヒューパーキンス

2
@HughPerkins問題は、pの不確実性を考慮して、pの不確実性と二項サンプリングの不確実性をどのように組み合わせるかだと思います。閉じた形式のソリューションはありますか?
EdM 2018年

@EdMあなたは私のポイントを得ました。閉じた形の解か分析的な近似があるのか​​しら。
DeltaIV

1
[オフトピック]ランダムなアイデアです。このような質問に対して「open-research-opportunity」のようなタグを付けるのは興味深いかもしれません/否定的な回答があった場合
Hugh Perkins、

回答:


4

これがブートストラップなしで動作するはずの1つの方法(実際には実装が最速の場合があります)は次のようになります。

  1. 予測された対数オッズ()の通常の近似に加えて、その標準誤差が機能すると仮定します。ロジスティック回帰ソフトウェアはこれを提供します。xβ^
  2. この分布の百分位数は、対数ロジットを介して確率に変換されます。
  3. 確率の予測分布をよく近似するベータ分布(の混合)を見つけることができます。
  4. 結果の予測分布は、ベータ2項分布(の混合)です(ステップ3で使用したのと同じ混合重みを持つ)。

別の方法として、結果の予測と対数オッズから対数オッズを「ちょうど」統合することもできますが、これは閉じた形のソリューションがない完全な混乱になると思います。


4
また、の漸近多変量正規分布から直接シミュレートし、それらの値に対して2項式の混合を形成することもできます。ββ^
Glen_b-モニカを復活させる

全体的なアイデアは気に入っていますが、詳細はわかりません。たとえば、「確率の予測分布をよく近似するベータ分布(の混合)を見つける」、これを実際にどのように行いますか?例を追加できますか?低次元のものでも十分です。
DeltaIV

3
必要に応じて、これを回答の形で何かとして書くことができます-どちらでもかまいません。
Glen_b-モニカを復元する

2
@Glen_b本当に感謝します。
DeltaIV

1
@Glen_b、私はその答えを見ることに興味があります。
Richard Hardy
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.