バギングは、N個の異なるブートストラップサンプルでN人の学習者を作成し、それらの予測の平均を取るプロセスです。
私の質問は次のとおりです。なぜ他のタイプのサンプリングを使用しないのですか?ブートストラップサンプルを使用する理由
バギングは、N個の異なるブートストラップサンプルでN人の学習者を作成し、それらの予測の平均を取るプロセスです。
私の質問は次のとおりです。なぜ他のタイプのサンプリングを使用しないのですか?ブートストラップサンプルを使用する理由
回答:
興味深い質問です。ブートストラップは、ジャックナイフなどの代替手段と比較して、優れたサンプリング特性を備えています。ブートストラップの主な欠点は、元のデータセットと同じ大きさのサンプル(計算コストがかかる可能性があります)ですべての反復を処理する必要があることですが、他のいくつかのサンプリング手法ははるかに小さなサンプルでも機能します。
このペーパーは、サンプルサイズをナイーブにカットすると、ブートストラップベースのバギングと比較してパフォーマンスが低下する可能性があることを示唆しています。また、これらの問題を回避しながら、より小さなサンプルをバギング推定に使用する新しい方法も紹介します。