ブートストラップ仮説検定で帰無仮説の下でデータを再サンプリングする必要があるのはなぜですか?


11

ブートストラップ法を仮説検定に直接適用することは、ブートストラップされたサンプルで繰り返し計算することにより、検定統計量の信頼区間を推定 することです(ブートストラップからサンプリングされた統計量)。仮説パラメーター(通常は0に等しい)がの信頼区間の外にある場合、を拒否します。 θ ^ θ * H0θ0 ^ θ *θ^θ^θ^H0θ0θ^

私は読んだことがあるが、この方法にはある程度の力がない。Hall P.とWilson SRによる記事「ブートストラップ仮説テストの2つのガイドライン」(1992)は、最初のガイドラインとして書かれており、ではなく、。そして、これは私が理解していない部分です。^ θ * -θ0θ^θ^θ^θ0

されていないことを措置推定量のバイアスだけ?不偏推定量の場合、この式の信頼区間は常により小さくなければなりませんが、テストと何が関係しているのかません。に関する情報を置く場所はどこにもありません。^ θ * ^ θ * -θ0 θ =θ0θ0θ^θ^θ^θ^θ0θ^=θ0θ0


この記事にアクセスできないあなたのために、これは論文の直後に来る関連する段落の引用です:

これが重要な理由を理解するために、場合、を拒否するテストが含まれることにして 「大きすぎる」です。もしの真の値から長い道のりです (すなわち、場合エラーはなはだしくである)、その後違い ノンパラメトリックブートストラップ分布と比較して、非常に大きく見えることはありません。より意味のある比較は、分布です。実際には、もし真の値 IS| θ - θ 0 | θ 0 θ H 0 | θ - θ 0 | | θ - θ 0 | | ^ θ * - θ | θ θ 1 | θ 1 - θ 0 | | ^ | θ - θ 0 |H0|θ^θ0|θ0θH0|θ^θ0||θ^θ0||θ^θ^|θθ1その後、ブートストラップテストのパワーは、として1に増加しテストがリサンプリングに基づいている場合、増加 、ただし、検定がリサンプリングに基づいている場合、パワーは最大で有意レベルに低下します(が増加するにつれて) |θ1θ0|| θ1-θ0||θ^θ^||θ1θ0||θ^θ0|

回答:


7

これがブートストラップの類推の原則です。(未知の)根底にある真の分布は、手元のサンプルとcdfを生成し、いくつかの関数の統計ました。ブートストラップを使用するあなたの考えは、既知の分布に基づいてサンプリング分布についてステートメントを作成することです。ここで、同じサンプリングプロトコルを使用しようとします(これはiidデータに対してのみ可能です。従属データは常に方法の制限につながります正確にサンプリングプロセスを再現できます)、同じ関数を適用します。私は別の投稿でそれを示しましxは1... X N F N θ = T F NT F T θ - θ 0 θ * F T T FF = F N T F NθFx1,,xnFnθ^=T(Fn)T()F~T()(私が思うところの)きれいな図で。したがって、(サンプリング+系統的)偏差のブートストラップアナログは、中心的な関心の量であり、分布について真であることがわかっているものからのブートストラップ複製の偏差です、適用したサンプリングプロセス、および関数。つまり、中心傾向の測定値はです。元のデータを置き換えて標準のノンパラメトリックブートストラップを使用した場合、なので、中心傾向の測定は、元のデータに基づいてなければなりません。θ^θ0θ^F~T()T(F~)F~=FnT(Fn)θ^

翻訳に加えて、ブートストラップテストで進行している微妙な問題があり、克服するのが難しい場合があります。nullの下の検定統計量の分布は、代替案の下の検定統計量の分布とは大幅に異なる場合があります(たとえば、ブートストラップ失敗するパラメーター空間の境界での検定)。 -testのような学部のクラスで学習する単純なテストはシフトの下で不変ですが、次のレベルの概念的な複雑さである漸近テストに移動する必要があると、「ヘック、私はすべてをシフトするだけ」と考えると失敗します。これについて考えてください。あなたはそのと、観察されたテストしています。次に、χ 2 μ = 0 ˉ X = 0.78 χ 2ˉ X - μ 2 /S 2 / N ˉ X 2 /S 2 / N ˉ X 2 * /S 2 * / N N ˉ X 2 / sの2tχ2μ=0x¯=0.78χ2 test with bootstrap analog場合、このテストには、本来の中央テストではなく、最初から非中心性が組み込まれています。ブートストラップテストを中心的なものにするには、元の推定値を実際に差し引く必要があります。(x¯μ)2/(s2/n)x¯2/(s2/n)x¯2/(s2/n)nx¯2/s2

のテストは、ピアソンの範囲の、多変量文脈で避けられない分割表のためにBollen-スタインのブートストラップ構造方程式モデルでの検定統計量の。これらの状況では、分布をシフトするという概念を明確に定義することは非常に困難です。ただし、多変量共分散行列の検定の場合、これは適切な回転によって実行できますχ 2χ2χ2


ありがとうございました。私がまだ理解しいないと思う人がいます:ブートストラップのどこにに関する情報を置くのですか?どこ falseで、かなり真の分布から外れている可能性があります。H 0 θ 0θ0H0θ0
アダムRyczkowski

nullの下でp値を計算するので、がnullに適合する場合を考慮する必要があります。もちろん、代替案を検討することは代替案の下で行う価値がありますが、それは...すごい...それはブートストラップテスト方法論の高度な使用法でしょう。θ0
StasK

3

わかりました。StasK、そのような良い答えをありがとう。他の人が学ぶためにそれを受け入れておくつもりですが、私の特定のケースでは私は非常に単純な事実を見逃していました:

簡単な1標本平均検定のHall&Wilsonガイドラインによるブートストラップの手順は次のとおりです(Rに触発された疑似コード)。

1function(dataθθ 00 ^ θ *θ ^ θ *θθ0 ) {
2 θ^ t.test(data, mu = θ0 )$statistic
3 count 0
4for(i in 1:1000){
5 bdata sample(data)
6 θ^ t.test(bdata, mu = θ^ )$statistic
7 if ( θ^θ^ ) count++
8 }
9 count/1000
10 }

私が見逃したのは、がで「使用された」ことです(参照を設定した場所)。θθ02θ^

これは、その行には、興味深いことです2し、6私たちは同じように簡単に使用することができますp.value代わりにstatistic。その場合、我々はまた、変更する必要がありますへラインに。7


私は以前に賛成票を投じましたが、これは実際には正しくないことに気付きました。ホール&ウィルソン(第2、PG。278)によると、の推定量であるあなたが示してきたように、ではない検定統計量。がする方法は、リサンプリングされた分布を形成し、かどうかを確認することですリサンプリングされた分布と比較して、「極端」に見えます。 θθ0 θ * - θ θ -θ0θ^θθ0(θ^θ^)(θ^θ0)
ハーフ渡す

1
おそらく役に立つでしょう:Michael Chernickは、ここで私の関連する質問に答えて簡潔な直感を提供しました。stats.stackexchange.com/questions/289236/...
ハーフパス
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.