私の全体的な質問は次のとおりです。なぜbayesglm
他の分類方法の代わりに使用するのですか?
注意:
- 私は予測だけに興味があります。
- 私はまともな量のデータを持っています(〜100,000 obs)。
サンプルサイズは、通常のロジスティック回帰のパラメーターが正規分布(CLT)になるのに十分な大きさだと思います。事前情報を指定すると何が得られますか?私の直感は、それが小さなデータセットに対してのみ問題になるということですが、私には理論的または適用された証拠はありません。
4
サンプルサイズと事前分布の関係についてのあなたの直感は正しいです。一方、ベイズロジスティック回帰は、完全な分離から生じる無限のパラメーター推定の問題を解決できます。
—
Sycoraxは2013
ロジスティック回帰は分類アルゴリズムではありません。確率予測アルゴリズムです。
—
ブラッシュ均衡
Sycoraxが言及していることは、大規模なサンプル設定でベイジアンモデルを使用する最も重要な理由の1つです。ロジスティック回帰に多数の予測子、特に分散の小さい予測子がある場合は、回帰係数よりも事前に考慮することを検討してください。
—
ブラッシュ均衡