ロジスティック回帰のまれなイベントの結果は何ですか?


9

サンプルサイズは、あらゆる統計的手法で検出力に影響することを知っています。各予測子に対して回帰が必要とするサンプル数の目安があります。

また、ロジスティック回帰の従属変数の各カテゴリのサンプル数が重要であるとよく耳にします。どうしてこれなの?

カテゴリの1つのサンプル数が少ない(まれなイベント)場合、ロジスティック回帰モデルに実際にどのような影響がありますか?

従属変数の各レベルの予測子の数とサンプル数の両方を組み込んだ経験則はありますか?



この参照が役立つと思います。Manel、S.、Williams、HC、Ormerod、SJ、2001。生態学における存在-不在モデルの評価:流行を説明する必要性。J. Appl。Ecol。38(5)、921〜931。dx.doi.org/10.1046/j.1365-2664.2001.00647.x不均衡なデータセットのモデリングについては、他にもたくさんあります。
Rafa_Mas 2017年

回答:


11

1015

N=300303XY


2
+1また、まれなイベントでは、真の切片を推定するために驚くほど多数のケースが必要になります(Harrell、p。233で、真の場合、真の値の0.1以内の予測確率を95%の信頼度で予測できると言われています。確率は切片のみのモデルでは0に近くなります)、不均衡なサンプリングがある場合、まれなイベントの修正
EdM

1
したがって、まれなイベントが推定切片にバイアスをかける可能性があります。まれなイベントが他の特定の問題(MLEの計算時の不整合、不安定性、収束の問題)を引き起こしますか?
Great38

@ Great38この回答の「完全な予測」の問題は、収束と幅広い標準エラーの問題につながる可能性があります。Hauck-Donner効果または完全な分離については、この投稿やその他の記事を参照してください。
EdM、2017年

10201060.00000000000001
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.