実数のサンプルを考えてみましょう。人口の中心的な傾向を推定し、この推定に関する不確実性を感じたいとしましょう。
人口分布についての仮説をとりあえず、次の2つのアプローチを考えてみましょう。
- 入力サンプルのブートストラップサンプルを取得します。つまり、置換してサンプリングし(たとえば、100リサンプルを取得)、各リサンプルの平均を計算します。次に、結果の平均の経験的分布の平均と信頼区間を出力します。
- 入力サンプルから平均値を出力し、推定値の不確実性を伝えるために平均値の周りの百分位数を出力します。
ブートストラップと元のサンプル:
- 私はアプローチ#1が何をするかを理解していますが。#2の背後にある根底にある推定量はありますか?
- #1のCIとは対照的に、#2の平均周辺のパーセンタイルは何を伝えますか?アプローチ#2は不確実な感覚を伝えますが、私はそれを頻出主義者またはベイズの解釈に関連付けるのに苦労しています。
- 方法#2 は、人口のより良い推定量を提供するでしょうか (例えば、偏りが少なく分散が低い)?