ブートストラップサンプルと元のサンプルの操作


8

実数のサンプルを考えてみましょう。人口の中心的な傾向を推定し、この推定に関する不確実性を感じたいとしましょう。

人口分布についての仮説をとりあえず、次の2つのアプローチを考えてみましょう。

  1. 入力サンプルのブートストラップサンプルを取得します。つまり、置換してサンプリングし(たとえば、100リサンプルを取得)、各リサンプルの平均を計算します。次に、結果の平均の経験的分布の平均と信頼区間を出力します。
  2. 入力サンプルから平均値を出力し、推定値の不確実性を伝えるために平均値の周りの百分位数を出力します。

ブートストラップと元のサンプル:

  • 私はアプローチ#1が何をするかを理解していますが。#2の背後にある根底にある推定量はありますか?
  • #1のCIとは対照的に、#2の平均周辺のパーセンタイルは何を伝えますか?アプローチ#2は不確実な感覚を伝えますが、私はそれを頻出主義者またはベイズの解釈に関連付けるのに苦労しています。
  • 方法#2 は、人口のより良い推定量を提供するでしょうか (例えば、偏りが少なく分散が低い)?

回答:


5

#2の推定量は、サンプル平均の間隔を生成するものです。ブートストラップを使用して、リサンプリング分布を使用して近似することにより、サンプル平均のサンプリング分布を取得しようとしています。

これは#1と#2でまったく同じ推定量であるため、#2は#と同じ真のプロパティを持ちます(実際の分布、依存の真のレベルなどが実際にはわからないため、それらは何でも)。 1、これらのプロパティの1つを2つの異なる方法で取得しようとしているだけです。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.