サンプルと、このサンプルのスタスティック(平均など)のブートストラップサンプルがあるとします。我々はすべて知っているように、このブートストラップサンプルは推定標本分布統計の推定のを。
さて、このブートストラップサンプルの平均は、元のサンプルの統計よりも母集団統計のより良い推定値ですか?どのような条件下でそれが当てはまりますか?
サンプルと、このサンプルのスタスティック(平均など)のブートストラップサンプルがあるとします。我々はすべて知っているように、このブートストラップサンプルは推定標本分布統計の推定のを。
さて、このブートストラップサンプルの平均は、元のサンプルの統計よりも母集団統計のより良い推定値ですか?どのような条件下でそれが当てはまりますか?
回答:
問題の核心に焦点を当てるように、一般化しましょう。疑問を残さないように、私は最も細かい詳細を綴ります。分析に必要なものは次のとおりです。
一連の数値z 1、… 、z mの算術平均は、次のように定義されます。
期待は線形演算子です。 場合すなわち、ランダム変数であり、α iは数値であり、次いで、線形結合の期待が期待の線形組み合わせです、
ましょ試料で(B 1、... 、BのK)データセットから得られたX = (X 1、... 、xはn個)取ることによってk個から均等要素をX交換に。ましょう、M (Bの)の算術平均であるB。これはランダム変数です。それから
期待の線形性が続きます。要素ので、全て同じやり方で得られ、それらはすべて同じ期待、持っているBの発言権:
これにより、前述の内容が単純化されます。
定義上、期待値は確率加重された値の合計です。各値は、選択される確率が1 / nであると想定されるため、
データの算術平均。
、質問に答えるためにいずれかを使用したデータは、平均場合集団平均値を推定するために、その後、ブートストラップ平均は(ケースであるK = N)も等しくˉ X、したがってある同じ集団の平均の推定として。
データの線形関数ではない統計の場合、同じ結果が必ずしも保持されるとは限りません。ただし、単にデータの統計値をブートストラップ平均に置き換えるのは間違っています。これはブートストラップの仕組みではありません。代わりに、ブートストラップ平均をデータ統計と比較することにより、統計のバイアスに関する情報を取得します。これを使用して、元の統計を調整してバイアスを除去できます。したがって、バイアス補正された推定値は、元の統計とブートストラップ平均の代数的組み合わせになります。詳細については、「BCa」(バイアス補正および高速化されたブートストラップ)および「ABC」を参照してください。 ウィキペディアにはいくつかの参照があります。
ブートストラップ分布は以下のように定義されているので、F N(X )= 1