有限母集団からのサンプルのブートストラップ


8

誰かが、既知のサイズの母集団から取得したサンプルをブートストラップすることについての理論の参照を私に指摘できますか?

私は、人口のサイズがサンプルよりもはるかに大きいと考えられる場合に、Bootstrapを使用してサンプルの信頼区間を計算することに慣れています(したがって、繰り返しによるランダムな選択は、サンプリングプロセスをうまくエミュレートするはずです)。

人口が1000で、800をサンプリングしたことがわかったとしましょう(サンプリングが実際にランダムであると仮定しましょう)。繰り返しを伴うランダム選択は適切ではないようです。ピジョンホールの原理により、サイズ800の別のランダムサンプルを実際に取得すると、少なくとも600の値が元のサンプルと同じであることが保証されます。

解決策はありますか?私は考えました:

  • 繰り返しで1000をサンプリングし、ランダムに800を選択します(従来のブートストラップと同等のアプローチのようです)
  • 繰り返しなしのサンプル600では、繰り返しありの800サンプルすべてを使用して200をさらにサンプリングします。これは、私が前に説明した効果を説明します。

これらのアプローチの良い点と悪い点について何か考えはありますか?または別のアプローチ?

回答:


6

ブートストラップサンプリングは、母集団からデータをサンプリングするプロセスに似ています。有限母集団の場合、分数をサンプリングしましたf サイズの人口のうち N、すなわち =fNケース。このようなシナリオでのブートストラップの使用には2つの問題があります。(1)従来のブートストラップを使用した場合、交換せずにではなく交換してサンプリングすること、(2)交換せずにサンプリングした場合f 場合、あなたはより小さなサンプルで終わるでしょう 。このような場合、ブートストラップは元のサンプリングプロセスに似ていないため、最初のシナリオは悪い考えです。有限人口の場合にブートストラップを使用するには、3つの選択肢があります。

  1. サンプル交換せずにサイズのサンプルf結果を再スケーリングします。適切な再スケーリング係数を見つけることは、それが聞こえるよりも複雑になる可能性があるため、これが最良の代替方法ではない可能性があります。
  2. 交換なしの最初のサンプル Nサンプルからケースを取り出し、それらをサンプルに連結してから、置換せずにサンプリングする それのうちのケース。これは、ミラーマッチブートストラップと呼ばれます。
  3. 交換後の最初のサンプル N あなたのサンプルからケースを取り出し、それからサンプルを取り出します 交換なしの場合。これは、スーパーポピュレーションブートストラップと呼ばれます。

これらの方法の詳細については、次のリソースを確認してください。

Davison、AC&Hinkley、DV(2009)。ブートストラップメソッドとそのアプリケーション。ニューヨーク、ニューヨーク:ケンブリッジ大学出版局。

シッター、RR(1992)。複雑な調査データのリサンプリング手順。Journal of the American Statistical Association、87(419)、755-765。

シッター、RR(1992)。調査データの3つのブートストラップ法の比較。Canadian Journal of Statistics、20(2)、135-154。


答えと参考文献をたくさんありがとう。私は答えからそれほど遠くないと思います、そして参照から多くの利益を確かに得るでしょう。
2016年

@Inoxはい、あなたは非常に近かったです:)
Tim
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.