サンプルサイズは、あらゆる統計的手法で検出力に影響することを知っています。各予測子に対して回帰が必要とするサンプル数の目安があります。
また、ロジスティック回帰の従属変数の各カテゴリのサンプル数が重要であるとよく耳にします。どうしてこれなの?
カテゴリの1つのサンプル数が少ない(まれなイベント)場合、ロジスティック回帰モデルに実際にどのような影響がありますか?
従属変数の各レベルの予測子の数とサンプル数の両方を組み込んだ経験則はありますか?
stats.stackexchange.com/questions/306122/...の stats.stackexchange.com/questions/178015/... (と同様の未回答の質問をたくさん)
—
HalvorsenのはKjetil B
この参照が役立つと思います。Manel、S.、Williams、HC、Ormerod、SJ、2001。生態学における存在-不在モデルの評価:流行を説明する必要性。J. Appl。Ecol。38(5)、921〜931。dx.doi.org/10.1046/j.1365-2664.2001.00647.x不均衡なデータセットのモデリングについては、他にもたくさんあります。
—
Rafa_Mas 2017年