ブートストラップ法はここ数年で大きな普及を見せています。特に背後にある推論が非常に直感的であるため、私もそれを頻繁に使用しています。
しかし、それは私が理解していないことの1つです。なぜエフロンが単一の観測をランダムに含めたり除外したりすることによる単純なサブサンプリングの代わりに、置換を伴うリサンプリングを選択したのですか?
ランダムサブサンプリングには1つの非常に優れた品質があると思います。これは、理想的には、私たちの調査で得られた観測が仮想母集団のサブセットである実際の状況を表しています。リサンプリング中に観測値を乗算することの利点はわかりません。実際の状況では、特に複雑な多変量の状況では、他の観測値と類似する観測値はありません。
3
モデルを考えると、それが正しいことなので、リサンプリングによるリサンプリングが行われます。ブートストラップの背後にあるモデルは、ノンパラメトリックな最尤法を使用して累積分布関数を推定し、推定された累積分布関数から独立した観測値をサンプリングすることです。考えてみてください---アルゴリズム的には、元のサンプルを置き換えてサンプリングすることで得られます。
—
kjetil b halvorsen 2015