代表的なサンプルをブートストラップしてnを無限に近づけることができるのに、なぜ仮説検定の威力が問題になるのですか?


7

コンピューターが遅い時代にもう生きていなくて、ノンパラメトリックなものに対して順列検定をブートストラップ/実行するのにコストがかかりすぎるのに、なぜ仮説検定の力を気にするのですか?

ブートストラップ/置換仮説検定を実行できる場合、電力分析は関係ありませんか?

「サンプルサイズ」をブートストラップで無限大にできるので、ブートストラップの結果として電力が増加しますか?

回答:


22

あなたが持っている仮説に関する情報の量は、単に元のデータの情報です。

ブートストラップ、順列テスト、その他のリサンプリングなど、その情報をリサンプリングしても、まだ存在していなかった情報を追加することはできません。

ブートストラップのポイントは、抽出された母集団の累積分布関数の近似値としてサンプル累積分布関数を使用することにより、本質的に、ある量のサンプリング分布を推定することです。

通常理解されているように、各ブートストラップサンプルは元のサンプルと同じサイズです(大きいサンプルを取得しても、持っているサンプルサイズでのサンプリングの変動については知らされないため)。変化するのは、そのようなブートストラップリサンプルの数です。

ブートストラップサンプルの数を増やすと、その近似の「正確な」感覚が得られますが、まだ存在していない情報は追加されません。

ブートストラップテストを使用すると、p値計算のシミュレーションエラーを減らすことができますが、近似している基になるp値(サンプルの関数にすぎません)をシフトすることはできません。それのあなたの見積もりは騒々しいだけではありません。

たとえば、ブートストラップされた1サンプルのt検定(一方的な代替案を使用)を行い、ブートストラップサンプルの数を増やすとどうなるかを見てみましょう。

t-statsticのブートストラップ分布のヒストグラム、ブートストラップのリサンプルは1000および10000

2に非常に近い青色の線は、サンプルのt統計を示しています。これは異常に高いことを示しています(推定p値はどちらの場合も類似していますが、そのp値の推定標準誤差は約30%大きくなっています。 2番目のもの)

質的に類似した画像-同じ基礎となる分布形状のノイズの多いバージョンとノイズの少ないバージョン-は、いくつかの統計の順列分布のサンプリングからも生じます。

情報は変更されていません。統計のブートストラップ分布の基本的な形は同じですが、ノイズの少ないアイデア(つまり、p値のノイズの少ない見積もり)が得られるだけです。

-

母集団の特定の分布形状など、テストで想定する必要のないものを指定する必要があるため、ブートストラップテストまたは置換テストを使用して電力分析を行うのは少しトリッキーです。特定の分布仮定の下で電力を評価できます。おそらくあなたは、どのような分布であるかについて特に良い考えを持っていないか、その情報を使用してテストを構築することができたでしょう(たとえば、あなたが理解しているものを反映する分布に対して優れた力を持つ何かから始めることによって)それから、おそらくそれをいくらか堅牢にするでしょう)。もちろん、状況に応じて、さまざまな可能な候補分布とさまざまな選択肢のシーケンスを調査できます。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.