私が作業している小さなデータセット()では、いくつかの変数が完全な予測/分離を提供します。したがって、この問題に対処するには、Firthロジスティック回帰を使用します。
AICまたはBICで最適なモデルを選択した場合、これらの情報基準を計算するときに尤度に第5ペナルティ項を含める必要がありますか?
2
変数を選択しても「変数が多すぎる、サンプルサイズが小さすぎる」という問題には役立たないため、なぜ避けられないのか説明していただけますか?
—
フランクハレル14年
それはそれが得るほど悪いです。
—
フランクハレル14年
これをベイジアン推論の問題と考えていますか?第5ロジスティック回帰は、jeffreys事前分布を使用したMAPと同等です。完全ラプラス近似を使用して限界尤度を評価できます-これは調整済みBIC(AICcと同様)のようなものです
—
確率論的
@user、そのような変数は通常少数のケースのみを予測し、それは再現不可能であるため、そのセルの真の確率は90%に近いかもしれませんが、その中に2つのケースしかないと、81%の時間で2つのケースを取得します。
—
StasK
Google Scholar、bemlar.ism.ac.jp
—
zhuang / Refs /