コルモゴロフスミルノフZ対マンホイットニーU小サンプルサイズn = 15？

サンプルサイズが15と小さいです。2つの独立変数、グループ1 n = 11、グループ2 n = 4の間で栄養素摂取量に違いがあるかどうかを確認したいと思います。データは正規分布していません。Mann Whitney UとKolmogorov-Smirnov Zのどちらのテストがより適切ですか？Andy FieldのSPSSを使用したDiscovering Statisticsは、KS Zは小さなサンプルサイズに使用する必要があると述べています。

Kolmogorov-Smirnov Z：第5章では、サンプルが正規分布母集団からのものであるかどうかをテストするKolmogorov–Smirnovテストに出会いました。これは別のテストです！実際、2つのグループが同じ母集団から引き出されているかどうかをテストします（その母集団が何であるかに関係なく）。つまり、これはマンホイットニー検定とほぼ同じことを意味します。ただし、このテストは、サンプルサイズがグループあたり約25未満の場合、マンホイットニー検定よりも優れたパワーを持つ傾向があるため、そうである場合は選択する価値があります。

また、p値とともに摂取量を報告する場合、データはノンパラメトリックなので、平均値と標準偏差または中央値とIQRを使用する必要がありますか？

何かアドバイスをいただければ幸いです。

— AMH40
ソース

データはそれらが何であるかです。それはだ手続きをしませノンパラメトリックあるいはパラメトリックあるデータ。この場合、データを投稿してください。軽度の非正常性は多くの手順にとって致命的ではありません。

— Nick Cox

Fieldによるそのテキストについては、stats.stackexchange.com / questions / 157217 /…で@whuberを参照してください。「このサイトで私たちが非常に混乱している質問のいくつかは、その本の読者からのものである必要があります。エラーでいっぱいです。誤った情報、そしてあからさまな会議。」

— Nick Cox

その本についても私は細心の注意を払います。あなたが引用するいくつかの主張が真実であるという証拠があるかどうかを調べることは、それらが正しいと仮定するよりも良いでしょう。

— Glen_b-モニカの復活2017

この質問を読んだのは、応答または結果変数と、2つのグループを定義する1つの予測子があるということです。従属変数と独立変数という用語は、不注意に逆転されることが多く、慣れ親しんでも、これらの用語を回避するためのいくつかの引数の1つです。

— Nick Cox

@Glen_bからの卓越した答えは、当然、特定のデータに光を当てるものではありません。投稿して、他の人におすすめを試してもらうこともできます。

— Nick Cox

元のステートメントがかなり実質的に適用される条件を制限しない場合、Fieldはこれについては間違っています。

引用されたセクションへの応答：

つまり、これはマンホイットニー検定とほぼ同じことを意味します。

いいえ、実際にはありません。彼らは本当にさまざまな種類のものをテストします。1つの例として、2つの対称に近い分布が広がりは異なるが場所は変わらない場合、コルモゴロフ-スミルノフはその種類の違い（効果に比べて十分に大きいサンプル）を識別できますが、ウィルコクソン-マン-ホイットニーできません。

これは、それらが異なる目的のために設計されているためです。

「しかし、サンプルサイズがグループあたり約25未満の場合、この検定はマンホイットニー検定よりも強力になる傾向があるため、そうである場合は選択する価値があります。」

$n<25$

[主張が真実であるいくつかの状況があるかもしれません。フィールドが彼の主張が適用されるコンテキストを説明しない場合、私はそれを推測することはできないでしょう。]

グループごとにn = 20のパワーカーブを次に示します。有意水準は、各テストで3％を少し超えています（実際、KSの達成可能な有意水準はわずかに高く、ランダム化された検定を使用してその差を調整することを試みていないため、この比較では小さな利点が与えられています）：

ご覧のとおり、この場合（最初に試したもの）はWilcoxon-Mann-Whitneyの方が明らかに強力です。

n = 5では、コルモゴロフ-スミルノフはこの状況ではあまり強力ではありません。[一体何を言っているのですか？彼は引用で言及されていないいくつかの状況で力を比較していますか？わかりませんが、ここで引用されていることだけを考えれば、その主張を額面どおりに受け取るべきではありません。私がチェックした最初のことは間違っていました。2つのテストに対する幅広い知識に基づいて、他の多くの状況については間違いだと思います。]

シフト代替（および通常の母集団）のサンプルサイズが4および11の場合も、ウィルコクソンマンホイットニーの方が優れています。

あなたが見ている変数で、適切な代替案はおそらくスケールシフトのようなものでしょう。しかし、データのパワー（平方根や立方根などが言うよりはまだログなど）があまりにも非標準的でない場合、これらの結果は関連があるはずです。いくつかの違いをもたらす可能性のある離散データまたはゼロインフレデータがある場合でも、コルモゴロフ-スミルノフがウィルコクソン-マン-ホイットニーを追い越さないのは私の賭けでしょう。[あなたの状況に関連しているかどうかがはっきりしないので、現時点ではこれを追求しません。]

さらに、Kolmogorov-Smirnovで達成可能な有意水準は、サンプルサイズが小さい場合に非常にギャップがあります。多くの場合、必要とする可能性が高い通常の有意水準に近いテストを取得できません。（WMWは、使用可能なテストサイズに関して、KSよりもはるかに優れています。このようなテストのノンパラメトリックまたはランクベースの性質を失うことなく、レベルのギャップ状況を劇的に改善するための巧妙な方法があります。これもまた、ランダム化されたテストが含まれますが、何らかの理由で使用されることはほとんどありません）。

$\alpha=0.05$

Wilcoxon-Mann-Whitneyがテストしたいものをテストする状況にいる場合は、代わりにKolmogorov-Smirnovを使用することをお勧めしません。私は各テストを、それらがテストするように設計されているものに使用します。

何が最善であるかを理解する最良の方法は、取得するデータの種類にとって現実的な状況でいくつかのシミュレーションを試すことです。次に、それがいつ何をするかを確認できます。

また、p値とともに摂取量を報告する場合、データはノンパラメトリックなので、平均値と標準偏差または中央値とIQRを使用する必要がありますか？

データは単なるデータです。これらはパラメトリックでもノンパラメトリックでもありません-これは、モデルの特性であり、モデル（推定、テスト、間隔）に依存する推論手順を使用しています。パラメトリックとは、「固定された有限数のパラメーターまで定義される」ことを意味し、データの属性ではなくモデルの属性です。両方の値のセットを与えることができない場合（これが私の好みです）、代わりにどちらか一方を選択する必要があります。どちらが科学的または関心のある質問に関連しているかを選択しますか？

[ウィルコクソン-マン-ホイットニーは平均も中央値も比較しないことに注意してください（この場合、適用に近づかないと思われるいくつかの仮定を追加しない限り）。コルモゴロフ=スミルノフもしない。]

— Glen_b-モニカの復活
ソース