少数の観測によるブートストラップ


8

のは、私が収集したとしましょう小さな私がテストしたいという仮説のための観測値の数(N)を。ブートストラップ法を使用して、N個の観測の平均結果のサンプル分布を生成できますが、Nが非常に小さくなると、このモデルが壊れて、サンプル分布自体にエラーが発生するのではないかと心配しています。

したがって、私の質問は、妥当な結果を得るために必要な最小Nをどのように決定できるかです。より定量的には、NはN-> 0としてサンプリングエラーにどのように関連付けられますか?

更新: Nの最小値は、基礎となるデータの性質によって異なることを理解するようになりました。それで、この場合、これを決定するのを助けるためにどのようなメタ観察を行うことができますか?私は本当の根本的なディストリビューションを知りません、さもなければブートストラップする必要はないでしょう。


1
Wasserman教授の講義ノートで興味深いコメントをstat.cmu.edu/~larry/=stat705/Lecture13.pdf見ました。pの式(21)の隣の表記 6は、関係するエラーが1 / sqrt(n)として減少することを示しています。残念ながら、定数係数については何も知りません。
最大

回答:


7

これはデータの真の分布の両方に常に依存するため、これに対する簡単な答えはありません(許容される唯一の値が1である縮退のケースを想像してください。次に、サイズ1のサンプルからのブートストラップは、何よりも優れています。 !)および計算する統計:一部の統計では、小さいサンプルサイズからの回復が他の統計よりも困難になります(極端な外れ値のリサンプリングを想像してください)。

したがって、これまでに提供したものよりも具体的にする必要があります。


1
観測値の分散を使用して、観測値に基づいて真の分布について推測できますか?極端な外れ値のケースは厳しいですが、これを見た場合は、多くの情報が含まれています。N> 2を指定するように質問を修正した場合、N2 = N2対N1!= N2である場合、2番目の観測はすでに何かを教えてくれます(そしてそれらの違いは何ですか)。
G__ 2011

極端なブートストラップは機能しません。
kjetil b halvorsen 2018
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.