2つの(非正規)分布が異なるかどうかをテストするにはどうすればよいですか?


13

スチューデントのt検定について読んだことがありますが、元の分布が正常に分布していると想定できる場合に機能するようです。私の場合、そうではありません。

また、13個のディストリビューションがある場合、13^2テストを行う必要がありますか?

これは、2つの分布のサンプルです。 13のディストリビューションがあります。


@Glen_bデータは離散的ではありません。値が-2から2までの範囲
マーチンベレス

回答:


19

「依存する」いくつかの感覚があります。

(潜在的な懸念の1つは、元のデータがおそらく離散しているように見えることです。これは明確にする必要があります。)

  1. サンプルサイズによっては、非正規性はt検定の問題ほど大きくない場合があります。少なくとも大規模なサンプルの場合、一般的にはレベルロバスト性が良好です。通常からそれほど遠くない場合でも、タイプIのエラー率はそれほど影響を受けません。尾が重いと、電力が問題になる場合があります。

  2. 分布のあらゆる種類の違いを探している場合は、2サンプルのKolmogorov-Smirnov検定などの2サンプルの適合度検定が適している場合があります(代わりに他の検定が行われる場合があります)。

  3. ロケーションファミリのロケーションタイプの違い、スケールファミリのスケールの違い、またはP(X> Y)> P(Y> X)タイプの関係だけを探している場合、Wilcoxon-Mann-Whitney 2つのサンプルテストが適している場合があります。

  4. 感度を持ちたい差異の種類に適した統計を見つけることができる場合、順列テストやブートストラップテストなどのリサンプリングテストを検討できます。

また、13個のディストリビューションがある場合、13 ^ 2テストを行う必要がありますか?

まあ、いいえ

AB BA

AA

これらの2つのことにより、ペアワイズ比較が169から78に削減されました。

第三に、それがために、まとめテストにはるかに通常の(しかしない義務)になる任意の違い、そして、おそらくでペアごとの違いを見て事後ペアワイズテストの最初のヌルが拒否された場合。

たとえば、上記の項目3のウィルコクソン-マン-ホイットニーの代わりに、グループ間の場所の違いに敏感なクラスカル-ワリス検定を行うことができます。

また、あるコルモゴロフ-スミルノフ検定のKサンプルバージョン、及び適合試験の他の二つのサンプルの良さのいくつかの同様の試験が存在する可能性、又は構成されること。

リサンプリングテストとt検定のkサンプルバージョンもあります(つまり、ANOVA、サンプルサイズがかなり大きい場合は大丈夫かもしれません)。


私たちが何を扱っているのか、そしてあなたが最も興味を持っているのはどのような種類の違いなのかについての情報をもっと得ることができれば本当に素晴らしいでしょう。失敗した場合、サンプルの一部のQQプロットを表示します。


(+1)人口CDFが交差しないと仮定する準備ができている場合、WWWテストは確率的優位性のテストとして解釈されることを付け加えます。IMOの人々は、それを知っていればそれを望んでいるでしょう。
Scortchi -復活モニカ

1
@Scortchi-はい。さらに他の解釈もあります。最も広くは、テストですP(X<Y)12

@Glen_bデータは離散的ではありません。値は-2 2の範囲で
マーチンベレス

うわー-重要な情報!それらはその範囲に制限されていますか(2.1は不可能です)、または値がその範囲内にあるということが起こりましたか?
-Glen_b-モニカーの復活2014

それらはその範囲に制限されています。
マーティンベレス14

5

はい、各ディストリビューションを他のディストリビューションに対してテストするよりも良いことはできないと思います...

あなたの質問がこれに関連していると思う場合:2つの分布の比較

Kolmogorov-Sminorv検定またはCramér-VonMises検定を使用することをお勧めします。どちらも非常に古典的な適合テストです。

ではRks.teststatsパッケージの関数が最初のものを実装します。2つ目は、などのパッケージにありますcramer

これらの2つのテストについて学習するには:http : //en.wikipedia.org/wiki/Kolmogorov%E2%80%93Smirnov_test http://en.wikipedia.org/wiki/Cram%C3%A9r%E2%80%93von_Mises_criterion


2

クラスカル–ワリス一元配置分散分析を試すことができます

「独立した、または関係のない3つ以上のサンプルの比較に使用されます」

ANOVAの正規性違反については、
Rutherford Introducing Anova and Ancova:A GLM Approach 9.1.2 Normality violationsで説明されています

最初の行は、「ほとんどのソースがANOVAを報告していますが...正規性の仮定の違反に関して堅牢であると報告しています...」


ありがとう!ペア比較を行う前にこのテストを実行する必要があるようです。
マーティンベレス14
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.