2つの大きく歪んだサンプルがあり、t統計を使用して平均を比較するためにブートストラップを使用しようとしています。
それを行う正しい手順は何ですか?
私が使用しているプロセス
これが正規分布ではないことがわかっている場合、最終ステップで元のデータまたは観測されたデータの標準誤差を使用することの妥当性を心配しています。
私の手順は次のとおりです。
- ブートストラップ-交換でランダムにサンプリング(N = 1000)
- 各ブートストラップのt統計を計算してt分布を作成します:
- t 分布のおよびパーセンタイルを取得してt信頼区間を推定する
信頼区間を取得するには:
where- 信頼区間がどこにあるかを見て、平均に有意な差があるかどうかを判断します(つまり、ゼロ以外)
Wilcoxonのランクサムも調べましたが、分布が非常に歪んでいるため(たとえば、75番目の== 95番目のパーセンタイル)、あまり合理的な結果は得られません。このため、ブートストラップされたt検定をさらに調査したいと思います。
だから私の質問は:
- これは適切な方法論ですか?
- かなり歪んでいることがわかっている場合、観測データのSEを使用することは適切ですか?
サンプルの大きさは?
—
マイケルM 14
@マイケルメイヤー800年頃
—
CatsLoveJazz 14