これはおそらく、いくつかの統計と数学(少なくとも計算)を理解している人を対象とした、より技術的な説明です。しばらく前に教えた調査ブートストラップのコースからのスライドは次のとおりです。
もちろん、いくつかの説明が必要です。は、既存のデータから統計を取得する手順です(技術的に正確には、分布関数から実数への関数です。たとえば、平均は。ここで、サンプル分布関数場合、はサンプル点の点質量として理解されます)。で示される母集団では、を適用すると、関心のあるパラメーターが得られます。ここで、サンプル(上部の最初の矢印)を取得し、経験的分布関数を取得しましたを適用して推定値を取得しますTE[X]=∫xdFFn()dFF()TθFn()Tθ^n。からどれくらい離れているのでしょうか?ランダム量が周りに持つ可能性のある分布は何ですか?これは、図の左下にある疑問符です。これは、ブートストラップが答えようとする質問です。gungの要点を言い換えると、これは人口に関する問題ではなく、特定の統計とその分布に関する問題です。θθ^nθ
サンプリング手順を繰り返すことができれば、その分布を取得して詳細を知ることができます。まあ、それは通常私たちの能力を超えています。ただし、
- Fnは、適切な意味でに十分に近く、かつF
- マッピングは十分に滑らかです。つまり、から小さな偏差を取得すると、結果はに近い数値にマッピングされます。TF()θ
ブートストラップ手順が機能することを期待できます。つまり、分布がではなくであると、それによりすべての可能なサンプルを楽しませることができます-そしてようなサンプルが存在します。これはのみ実用的です。私はもう一度繰り返してみましょう:ブートストラップの標本分布の作成に取り組んでいます「真」のパラメータの周り、我々は2つの以上の条件で、このサンプリング分布は標本分布について有益であることを願っています周りの:Fn()F()nnn≤5θ^∗nθ^nθ^nθ
θ^∗n to θ^n is like θ^n to θ
さて、だけではなく、矢印に沿って一方向に行くと、これらの矢印に沿っていくつかの情報/精度を失う、我々は戻っての変動について何か言うことができる周り。θ n個θ^∗nθ^n
上記の条件は、Hall's(1991)の書籍で最大限の専門性を示しています。このスライドを見つめるための前提条件として私が言った計算の理解は、滑らかさに関する2番目の仮定です。より形式的な言語では、関数は弱い導関数を持たなければなりません。最初の条件は、もちろん、漸近的なステートメントです。サンプルが大きいほど、は近くなります。以下とからの距離するからのものと同程度の大きさでなければなりませんへの。これらの条件は壊れる可能性があり、それらは壊れますF N F θ * nはθ nはθ nは θ FTFnFθ^∗nθ^nθ^nθに十分近い経験的分布を生成しない、十分に奇妙な統計および/またはサンプリングスキームを使用する多くの実際的な状況で。F
さて、その1000個のサンプル、またはマジックナンバーはどこから来るのでしょうか?すべてのサンプルを描画できないため、これらのランダムなサブセットを取得します。右端の「シミュレーション」矢印は、の分布を取得する途中で作成している別の近似を示しています。つまり、モンテカルロがは、周りのの完全なブートストラップ分布の十分な近似です。θ nは θ θ (* R )のn θ * のn θ n個nnθ^nθθ^(∗r)nθ^∗nθ^n