ウィルコクソン符号順位検定の妥当性
Cross Validatedのアーカイブを少し調べてみましたが、質問に対する回答が見つかりませんでした。私の質問は次のとおりです。ウィキペディアは、ウィルコクソンの符号付き順位検定(私の質問では少し変更されています)を維持するために必要な3つの仮定を示しています。 i = 1、...、nに対してZi = Xi-Yiとします。 差Ziは独立していると想定されます。 (a。)各Ziは同じ連続母集団に由来し、(b。)各Ziは共通の中央値について対称です。 XiとYiが表す値は順序付けされています。したがって、「より大きい」、「より小さい」、および「等しい」の比較が役立ちます。 ただし、Rの?wilcox.testのドキュメントには、(2.b)が実際には手順でテストされるものであることが示されているようです。 「... xとyの両方が指定され、ペアがTRUEの場合、x-yの分布(ペアの2つのサンプルの場合)がmuについて対称であるというヌルのウィルコクソン符号順位検定が実行されます。」 これは、「Zが中央値mu = SomeMuの周りに対称的に分布している」という帰無仮説に対してテストが実行されているかのように聞こえます。つまり、null の棄却は、対称性の棄却か、その周りのmuの棄却のどちらかです。 Zは対称ですSomeMuです。 これはwilcox.testのRドキュメントの正しい理解ですか?もちろん、これが重要な理由は、いくつかの前後のデータ(上記の「X」と「Y」)でいくつかの対応のある差分テストを行っているためです。「前」と「後」のデータは個別に大きく歪んでいますが、その差はほとんど歪んでいません(まだ多少歪んでいますが)。つまり、単独で考慮された「前」または「後」のデータには歪度〜7〜21(見ているサンプルによって異なります)があり、一方「差異」のデータには歪度〜= 0.5〜5があります。しかし、それほど多くはありません。 私の「差異」データに歪度があると、ウィルコクソン検定が誤った/偏った結果をもたらす(Wikipediaの記事に示されているように)場合、歪度は大きな問題になる可能性があります。ただし、ウィルコクソン検定が実際に差分分布が「mu = SomeMuの周りで対称」であるかどうかを検定している場合(?wilcox.testが示すように)、これはそれほど問題ではありません。 したがって、私の質問は次のとおりです。 上記のどの解釈が正しいですか?「差異」分布の歪度は、ウィルコクソン検定にバイアスをかけますか? 歪度が懸念事項である場合:「どの程度の歪度が懸念事項ですか?」 ウィルコクソンの符号付き順位検定がここでは著しく不適切と思われる場合、何を使用すればよいかについての提案はありますか? 本当にありがとう。私がこの分析をどのように行うかについてさらに提案があれば、私はそれらを聞いてとても嬉しく思います(ただし、その目的のために別のスレッドを開くこともできます)。また、これはCross Validatedに関する最初の質問です。私がこの質問にどのように質問したかについての提案/コメントがあれば、私もそれを受け入れます! 少し背景:私は「会社の生産におけるエラー」と呼ぶものについての観察を含むデータセットを分析しています。サプライズインスペクションの前後で製造プロセスで発生するエラーについて観察しました。分析の目的の1つは、「検査によって、観測されたエラーの数に違いがあるか」という質問に答えることです。 データセットは次のようになります。 ID, errorsBefore, errorsAfter, size_large, size_medium, typeA, typeB, typeC, typeD 0123,1,1,1,0,1,1,1,0 2345,1,0,0,0,0,1,1,0 6789,2,1,0,1,0,1,0,0 1234,8,8,0,0,1,0,0,0 約4000の観測があります。その他の変数は、企業の特性を説明する分類的観測です。サイズは、小、中、大のいずれかであり、各企業はそれらの1つだけです。会社は「タイプ」のいずれかまたはすべてです。 すべての企業とさまざまなサブグループ(サイズとタイプに基づく)の検査の前後で、観測されたエラー率に統計的に有意な差があるかどうかを確認するために、いくつかの簡単なテストを実行するように依頼されました。たとえば、Rでデータが次のように見える前と後の両方でデータが大幅に歪んでいたため、T検定は失敗しました。 summary(errorsBefore) # Min. 1st …