リサンプリングに適したテキストですか?


10

グループは、適用されたリサンプリング手法に適切な紹介テキスト/リソースを推奨できますか?具体的には、正規性などの仮定に明らかに違反している場合にグループを比較するために、従来のパラメトリック検定(t検定、ANOVA、ANCOVAなど)の代替案に興味があります。

解決するためのより良い方法について自分自身を教育したい問題の種類の例には、次のようなものが含まれます。

I)
2グループ:治療と管理

依存変数:介入後の口座残高の変化

共変量:介入前勘定残高のドル。

ANCOVAの適用に関する問題:多くの被験者には変化がありません(多くのゼロ)。

II)
2グループ:治療と管理

依存変数:新しいアカウントが追加されました

共変量:介入前のアカウント数。

*多くの被験者にはアカウントが追加されません(多くのゼロ)。

ブートストラップを使用できますか?順列検定?これは、ノンパラメトリックリサンプリング手法を適用したいタイプの分析です。

回答:


5

参考資料として、適用される教科書として、フィリップグッドの「リサンプリング手法:データ分析の実用ガイド(ビルハウザーボストン、2005年、第3版)」をお勧めします。そして、これがブートストラップリサンプリングの注釈付き参考文献ですリサンプリング手法:概念、アプリケーション、および正当化も良いスタートを提供します。

リサンプリング手法の使用を容易にする多くのRパッケージがあります。

(他にもたくさんのパッケージがあります...)


@chiと@whuber:ありがとう、良い本が良い選択なのかと思っていました。私が示した問題の種類について-基本的に違反のあるANCOVAですが、順列またはブートストラップで正しい軌道に乗っていますか?
B_Miner

@ user2040順列テストで失敗するのは難しいです。グッドには、特に多因子計画、カテゴリーデータ、および多変量解析(MANCOVAを含む)に関する章があります。私はあなたの特定の問題を完全に理解しているわけではありませんが、あなたはそこであなたが何か役に立つものを見つけると確信しています。
whuber

@ user2040いくつかの参考文献を追加しますが、あなたの2つの点も理解しにくいと思いました。私の知る限り、共変量が連続である場合、正確な順列検定はありません。
10

1
@chl連続共変量についてのコメントを正しく理解できれば、その正確さはデータのランダム性が果たす役割に依存すると思います。ランダム化が意図的に行われる場合、どのような種類のデータを持っているかは問題ではないようです。順列テストでは、データを指定どおりに取得し、乱数ジェネレーターによって(たとえば)対象が治療グループと対照グループに異なる割り当てになった場合の統計結果がどのようになるかを簡単に確認できます。
whuber

@chiと@whuber、ありがとうございます。私は良い本のどれが一番良いか見てみます(多くの駄洒落が意図されています)。私の問題に関する限り、基本的には2つのサンプルの実験(処理とコントロール/処理なし)であり、実験前のベースラインメジャーと処理後のメジャーがあり、後者は従属変数です(実際にはメジャーの変化です)プレからポストへ)。したがって、ポストの測定値の多くがゼロであることを除いて(顧客が何も購入しなかった)ことを除いて、それは典型的なANCOVAまたはANOVA(変更が依存であるかポストであるかに応じて、プレを共変量として)になります。
B_Miner 2010

4

フィリップグッド、順列、パラメトリック、およびブートストラップ検定の仮説(第3版)。スプリンガー、2005年。

この本は数学的に簡単で、アクセス可能で、幅広いアプリケーションをカバーしています。


(+1)ああ...同じ本を引用しました:)
chl

@chl私はそうは思いません。彼らは同じ著者によるものですが、タイトルや発行者が少し異なります。多分私達はそれぞれにそれらについてもう少し言うべきです、それで私達はOPにどちらがより適切かもしれないかを決定することができます。返信のコメントにいくつかの詳細を追加しました。
whuber

私はあなたのものを見た後に私を削除しました。
10

@chlああ、なるほど。したがって、冗長性はありません。
whuber
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.