ブートストラップサンプルのサイズ


9

サンプル統計の分散を推定する手段として、ブートストラップについて学習しています。基本的な疑問が1つあります。

http://web.stanford.edu/class/psych252/tutorials/doBootstrapPrimer.pdfからの引用:

•いくつの観測をリサンプリングする必要がありますか?良い提案は、元のサンプルサイズです。

元のサンプルと同じ数の観測をリサンプリングするにはどうすればよいですか?
サンプルサイズが100で、平均の分散を推定しようとしています。合計サンプルサイズ100からサイズ100の複数のブートストラップサンプルを取得するにはどうすればよいですか?この場合、ブートストラップサンプルは1つだけ可能です。これは、元のサンプルと同じですか。

私は明らかに非常に基本的なことを誤解しています。私はあることを理解理想的なブートストラップサンプルは常に無限である、と心の中で自分の必要な精度を保ち、私は収束のためにテストする必要があると思います私のデータのために必要なブートストラップサンプルの数を決定します。
しかし、私は個々のブートストラップサンプルのサイズがどうあるべきかについて本当に混乱しています。


7
pの上。3、およびそこにあるイラストは、リサンプリングが置換を伴う
whuber

しかし、私のブートストラップのサンプルサイズが私が持っている観察の総数と同じである場合、何に置き換えればよいですか?
user1265125 2016年

簡単な例-サンプルセットとして4、1、3、7、5を使用している場合。サイズ5のブートストラップサンプルを複数作成するにはどうすればよいですか?サイズ5のブートストラップサンプルは、4、1、3、7、5、つまり元のサンプルセットのみです。
user1265125 2016年

1
わかりました-「•サンプリング分布をシミュレートするには、サンプルの多数のコピーで構成されるこの「母集団」から、ランダムなサンプルを繰り返すだけです」
user1265125

回答:


16

ブートストラップは、交換を伴うサンプリングによって行われます。「入れ替えあり」という言葉がわかりにくいようです。whuberが述べたように、置換を伴うサンプリングの例はp。あなたが参照する論文の3つ(以下に複製)。

交換後のサンプリングのイラスト

(ソース:http : //web.stanford.edu/class/psych252/tutorials/doBootstrapPrimer.pdf

置換によるサンプリングの一般的な考え方は、どのケースも複数回サンプリングできるということです(上の最初の画像では緑の大理石、最後の画像では青と紫の大理石)。このプロセスを想像したい場合は、カラフルな大理石で満たされたボウルを考えてください。このボウルからいくつかのビー玉を描きたいとしましょう。交換せずにサンプリングした場合は、ボウルからビー玉を取り出し、サンプリングしたものを脇に置くだけです。交換してサンプリングした場合、ボウルから大理石を1つ取り出し、ノートブックにその色を書き留めてから戻すことにより、大理石を1つずつサンプリングします。ボウルに。したがって、交換してサンプリングする場合、同じ大理石を複数回サンプリングできます。

nnnnnnn

あるのサンプリングの方法なしで交換大きさの人口のうち、例とサンプリングの方法交換します。その背後にある数学の詳細については、2.1を確認してくださいHossein Pishro-Nikによる、Introduction to ProbabilityオンラインハンドブックのCombinatoricsの章。WolframMathWorldページには便利なチートシートもあります。 kn n+k1(nk)kn(n+k1k)


0

いくつの観測を再サンプリングする必要がありますか?良い提案は、元のサンプルサイズです。

元のサンプルサイズが大きすぎて、完全なデータセットでモデルをトレーニングしたくない、またはトレーニングできない場合、「良い提案」はあまり良くありません。

PS:これをコメントとしてコメントに追加したかったのですが、コメントを追加することはできません...


1
なぜこの提案を追加したいのですか?これがデータセットが通常の計算作業には大きすぎるためである場合、それは関連する実際的な問題ですが、ここで質問されたブートストラップの理論には実際には適用されません。さらに、これは「サンプル統計の分散の推定」に関するものでした。これは一般的にモデルのトレーニングに本当に関連していますか?(失礼な言い方をすると、まだコメントを投稿できないことは承知していますが、そのように投稿するときに関連する回答を提供することから解放されるわけではありません。もっと明確にするか、独自の質問を投稿する必要があります)
IWS
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.