ブートストラップを使用して、2つの方法を使用して有意差検定のp値を計算します。
- 帰無仮説の下でリサンプリングし、元のデータからの結果と少なくとも同じくらい極端な結果をカウントする
- 対立仮説の下でリサンプリングし、帰無仮説に対応する値と少なくとも元の結果から離れた結果をカウントする
最初のアプローチは、p値の定義に従っているため、完全に正しいと思います。2番目についてはよくわかりませんが、通常は非常によく似た結果が得られ、Waldテストを思い出させます。
私は正しいですか?どちらの方法も正しいですか?それらは同じですか(大きなサンプルの場合)?
2つの方法の例(DWinの質問とErikの回答の後に編集):
例1. 2つのサンプルのT検定に似たブートストラップ検定を作成してみましょう。方法1は、1つのサンプルからリサンプリングします(元の2つをプールすることによって取得されます)。方法2では、両方のサンプルから個別にリサンプリングします。例2.x₁…xₐとy₁…yₐ間の相関のブートストラップテストを作成してみましょう。方法1は、相関がないと仮定し、(xₑ、yₔ)ペアを考慮してリサンプリングします。ここでe≠əです。方法2は、元の(x、y)ペアのブートストラップサンプルをコンパイルします。
例3.コインが公正かどうかを確認するブートストラップテストを作成してみましょう。方法1では、Pr(head)= Pr(tail)=½を設定してランダムサンプルを作成します。方法2は、実験的なヘッド/テール値のサンプルをリサンプリングし、比率をtoと比較します。