ブートストラップテストを実行して2つのサンプルの平均を比較する方法


12

2つの大きく歪んだサンプルがあり、t統計を使用して平均を比較するためにブートストラップを使用しようとしています。

それを行う正しい手順は何ですか?


私が使用しているプロセス

これが正規分布ではないことがわかっている場合、最終ステップで元のデータまたは観測されたデータの標準誤差を使用することの妥当性を心配しています。

私の手順は次のとおりです。

  • ブートストラップ-交換でランダムにサンプリング(N = 1000)
  • 各ブートストラップのt統計を計算してt分布を作成します:
    Tb=バツ¯b1バツ¯b2バツ¯1バツ¯2σバツb12/n+σバツb22/n
  • t 分布のおよびパーセンタイルを取得してt信頼区間を推定するα/21α/2
  • 信頼区間を取得するには:

    CL=バツ¯1バツ¯2T_CLSEorgnal
    Cうん=バツ¯1バツ¯2+T_CうんSEorgnal
    where
    SE=σバツ12/n+σバツ22/n
  • 信頼区間がどこにあるかを見て、平均に有意な差があるかどうかを判断します(つまり、ゼロ以外)

Wilcoxonのランクサムも調べましたが、分布が非常に歪んでいるため(たとえば、75番目の== 95番目のパーセンタイル)、あまり合理的な結果は得られません。このため、ブートストラップされたt検定をさらに調査したいと思います。

だから私の質問は:

  1. これは適切な方法論ですか?
  2. かなり歪んでいることがわかっている場合、観測データのSEを使用することは適切ですか?

重複の可能性:ブートストラップテストまたはノンパラメトリックランクベーステストのどの方法が推奨されますか?


サンプルの大きさは?
マイケルM 14

@マイケルメイヤー800年頃
CatsLoveJazz 14

回答:


16

私は通常のブートストラップテストをするだけです:

  • データのt統計を計算して保存する
  • 帰無仮説が真になるようにデータを変更します。この場合、グループ1のグループ1の平均を減算し、全体の平均を加算し、グループ2に対して同じことを行います。これにより、両方のグループの平均が全体の平均になります。
  • このデータセットから、おそらく20,000程度のブートストラップサンプルを取得します。
  • これらの各ブートストラップサンプルでt統計を計算します。これらのt統計の分布は、帰無仮説が真である場合の、歪んだデータのt統計のサンプリング分布のブートストラップ推定です。
  • 観測されたt統計値以上のブートストラップt統計値の割合は、値の推定値です。あなたはを見て、少し良く行うことができますより大きいか、観測t統計量に等しい、ブートストラップt値の数で割った値ブートストラップ標本の数。ただし、ブートストラップのサンプル数が多い場合、差は小さくなります。p+1+1

詳細については、以下をご覧ください。


これは基本的にImが行っていることですが、元の/観測されたt統計がブートストラップされたt統計の時間の割合を見ることになります。最初のインスタンスで大きく歪んだデータでt検定をしても構いませんが、これが私がブーストしたい理由の1つです。
CatsLoveJazz 14

2
技術的には、ブートストラップテストにはテスト統計が必要なだけなので、問題はありません。実質的に、t検定は平均を比較し、歪んだデータの中央値は平均よりも有意義であることがよくあります。したがって、平均値ではなく中央値を比較するテストの方が意味があります。ただし、それはあなたの帰無仮説に依存します。これはあなたの選択であり、あなただけの選択です。
マールテンビュイ14

おかげで、他のすべての出力はこの形式になっているので、テストしたいという意味です。
CatsLoveJazz 14
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.