ブートストラップと置換仮説のテスト


37

ブートストラップ、置換テスト、ジャックナイフなど、実際によく使用されるいくつかの一般的なリサンプリング手法があります。たとえば、Philip I Good(2010)Permutation、Parametric、Bootstrap Tests仮説の

私の質問は、どのリサンプリング手法がより人気があり、実装しやすいのですか?ブートストラップまたは置換テスト?


8
人気は品質の良い尺度とはいえません。引用(顧客)の数から判断すると、マクドナルドはミシュランの3つ星ホテルよりもはるかに人気のある(優れた)レストランです。それでは、次のセミナースピーカーをマクドナルドに連れていきますか?
StasK

回答:


68

どちらも人気があり便利ですが、主にさまざまな用途に使用されます。順列検定は仮説の検定に最適であり、ブートストラップは信頼区間の推定に最適です。

順列検定では、交換可能性の特定の帰無仮説、つまり、ランダムサンプリング/ランダム化のみが見られる違いを説明するという仮説をテストします。これは、t検定やANOVAなどの一般的なケースです。また、時系列(連続相関がないという帰無仮説)や回帰(関係のない帰無仮説)などに拡張することもできます。順列検定は信頼区間を作成するために使用できますが、より多くの仮定が必要であり、合理的である場合とそうでない場合があります(したがって、他の方法が推奨されます)。Mann-Whitney / Wilcoxonテストは、実際には置換テストの特別なケースであるため、一部の人が理解するよりもはるかに人気があります。

ブートストラップは、サンプリングプロセスの変動性を推定し、信頼区間の推定に適しています。この方法で仮説の検定を行うことはできますが、順列検定の仮定が当てはまる場合、置換検定よりも強力ではない傾向があります。


2
答えてくれてありがとう。ブートストラップの信頼区間が置換テストよりも強力でないのはなぜですか?いくら?それほど強力ではない状況を特徴付けることはできますか?信頼区間を表示できることは利点のように思えるので、その意味でブートストラップはより価値があるようです。
dfrankow 14

2
@ dfrankow、2つの方法は異なる仮定を使用します。大きいサンプルと差の場合、両方とも問題ありませんが、小さいサンプル/差の場合、置換テストは差を見つけて適切である可能性が高くなります。この回答を参照してください:stats.stackexchange.com/questions/112147/…ブートストラップのサイズが正しくない場合の例(nullがtrueの場合に拒否が多すぎる)。
グレッグスノー14

順列テストはブートストラップのバリエーションではありませんか?
ヴィッキーB

@VickiB、ブートストラップおよび置換テストはよく一緒に言及されますが、サンプルを置換で置換し、置換サンプルを置換なしでブーストすることで、何ができるか、そしてどれだけ強力であるかが異なります。
グレッグスノー


8

私の質問は、どのリサンプリング技術がより人気のある
ブートストラップまたは置換テストを獲得したかということです。

  1. ブートストラップは、主に大きなサンプル標準エラーまたは信頼区間の生成に関するものです。名前が示すように、置換テストはほとんどテストに関するものです。(ただし、それぞれを他のタスクに使用するように適合させることができます。)

  2. 人気をどのように判断しますか?心理学や教育などの分野を見ると、Wilcoxon-Mann-Whitney、署名されたランクテスト、ランク相関テストなどのランクベースのテストを多く使用できます。これらはすべて置換テストです(一方で、元のデータの置換テストを代わりに使用できる場合が多くありますが、通常はそうではありません)。他の一部のアプリケーション領域では、置換テストはほとんど使用されませんが、アプリケーション領域間での人気の違いは、有用性よりも、その領域のローカルカルチャーについてより多くを語る場合があります。

実装が簡単ですか?

多くの場合、特にシンプルなものはほとんど同じように簡単です-それは本質的に、交換を伴うサンプリングと交換を伴わないサンプリングの違いです。

より複雑なケースのいくつかでは、(テストの観点から見て)ブートストラップはnullではなく代替の下で動作するため、ブートストラップが簡単です(少なくとも単純な実装は-それがうまく機能するように行うことです)もっと複雑かもしれません)。

適切な交換可能な量が観察できない場合があるため、より複雑なケースでは正確な順列テストが困難になる可能性があります-ほぼ交換可能な量は、正確さの代価(および真に流通なし)で代用されることがあります。

ブートストラップは、基本的に対応する正確性基準(間隔の正確なカバレッジ)を最初からあきらめ、代わりに大きなサンプルで合理的に良好なカバレッジを取得しようとすることに焦点を当てます(理解できないほど成功する場合があります;チェックしていない場合は、ドンブートストラップが期待するカバレッジを提供すると仮定しないでください)。

順列検定は小さなサンプルで機能しますが(有意レベルの選択の制限は非常に小さなサンプルでは問題になる場合があります)、ブートストラップは大きなサンプルの手法です(小さなサンプルで使用する場合、多くの場合、結果は非常に有用である)。

私はそれらを同じ問題の競合他社とはめったに見ず、(異なる)実際の問題でそれらを使用しました。

両方に利点がありますが、パナケアにはありません。そのうちの1つだけに焦点を合わせて学習の労力を減らしたい場合は、失望する可能性があります。両方ともリサンプリングツールボックスの重要な部分です。


1
適切な交換可能な量が観察できない場合がある」とはどういう意味かを明確にしていただけますか?(当然1)
usεr11852が復活モニック言う

1
2つの因子と共変量を使用した実験で順列検定を実行することを検討してください(または、いくつかの予測変数を使用した回帰を検討してください)。独立性があり、影響がまったくないヌルの場合、観測値は交換可能であるため、その仮説をテストできますが、因子のみの順列検定を構築する方法はありません(共変量には効果があると予想されるため) nullであることをテストするのは面白くない); 同様に、2つの要因のうち1つだけの順列検定を作成することはできません。... ctd
Glen_b -Reinstate Monica

1
ctd ...テストしていない母集団係数がわかっていれば(そしてエラーは常に交換可能です)、明らかな交換可能な数量がありますが、それらを観察することはできません。係数またはエラー(残差)の推定値を代入すると、数量はより長く交換可能になります。しかし、特定の条件下では、それらはほぼ交換可能です(一部の人々はこれを正確に行うことを提唱しています)....そうすると、ブートストラップに似たものになりますが、交換によるサンプリングの代わりに交換なしのサンプリングが行われます。
Glen_b-モニカを

ありがとうございました; これについて慎重に考えます。ここでもっと学ぶべきことがあると思います。:)
usεr11852は回復モニック言う

1
何らかの理由で@NULLが、参照のリクエストを逃しました。開始点については、こちらを参照のいくつかは、実行する必要があります。davegiles.blogspot.com/2019/04/...
Glen_b -Reinstateモニカ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.