ウィルコクソン符号順位検定の妥当性


11

Cross Validatedのアーカイブを少し調べてみましたが、質問に対する回答が見つかりませんでした。私の質問は次のとおりです。ウィキペディアは、ウィルコクソンの符号付き順位検定(私の質問では少し変更されています)を維持するために必要な3つの仮定を示しています。

i = 1、...、nに対してZi = Xi-Yiとします。

  1. 差Ziは独立していると想定されます。

  2. (a。)各Ziは同じ連続母集団に由来し、(b。)各Ziは共通の中央値について対称です。

  3. XiとYiが表す値は順序付けされています。したがって、「より大きい」、「より小さい」、および「等しい」の比較が役立ちます。

ただし、Rの?wilcox.testのドキュメントには、(2.b)が実際には手順でテストされるものであることが示されているようです。

「... xとyの両方が指定され、ペアがTRUEの場合、x-yの分布(ペアの2つのサンプルの場合)がmuについて対称であるというヌルのウィルコクソン符号順位検定が実行されます。」

これは、「Zが中央値mu = SomeMuの周りに対称的に分布している」という帰無仮説に対してテストが実行されているかのように聞こえます。つまり、null の棄却は、対称性の棄却、その周りのmuの棄却のどちらかです。 Zは対称ですSomeMuです。

これはwilcox.testのRドキュメントの正しい理解ですか?もちろん、これが重要な理由は、いくつかの前後のデータ(上記の「X」と「Y」)でいくつかの対応のある差分テストを行っているためです。「前」と「後」のデータは個別に大きく歪んでいますが、その差はほとんど歪んでいません(まだ多少歪んでいますが)。つまり、単独で考慮された「前」または「後」のデータには歪度〜7〜21(見ているサンプルによって異なります)があり、一方「差異」のデータには歪度〜= 0.5〜5があります。しかし、それほど多くはありません。

私の「差異」データに歪度があると、ウィルコクソン検定が誤った/偏った結果をもたらす(Wikipediaの記事に示されているように)場合、歪度は大きな問題になる可能性があります。ただし、ウィルコクソン検定が実際に差分分布が「mu = SomeMuの周りで対称」であるかどうかを検定している場合(?wilcox.testが示すように)、これはそれほど問題ではありません。

したがって、私の質問は次のとおりです。

  1. 上記のどの解釈が正しいですか?「差異」分布の歪度は、ウィルコクソン検定にバイアスをかけますか?

  2. 歪度懸念事項である場合:「どの程度の歪度が懸念事項ですか?」

  3. ウィルコクソンの符号付き順位検定がここでは著しく不適切と思われる場合、何を使用すればよいかについての提案はありますか?

本当にありがとう。私がこの分析をどのように行うかについてさらに提案があれば、私はそれらを聞いてとても嬉しく思います(ただし、その目的のために別のスレッドを開くこともできます)。また、これはCross Validatedに関する最初の質問です。私がこの質問にどのように質問したかについての提案/コメントがあれば、私もそれを受け入れます!


少し背景:私は「会社の生産におけるエラー」と呼ぶものについての観察を含むデータセットを分析しています。サプライズインスペクションの前後で製造プロセスで発生するエラーについて観察しました。分析の目的の1つは、「検査によって、観測されたエラーの数に違いがあるか」という質問に答えることです。

データセットは次のようになります。

ID, errorsBefore, errorsAfter, size_large, size_medium, typeA, typeB, typeC, typeD
0123,1,1,1,0,1,1,1,0 
2345,1,0,0,0,0,1,1,0
6789,2,1,0,1,0,1,0,0
1234,8,8,0,0,1,0,0,0

約4000の観測があります。その他の変数は、企業の特性を説明する分類的観測です。サイズは、小、中、大のいずれかであり、各企業はそれらの1つだけです。会社は「タイプ」のいずれかまたはすべてです。

すべての企業とさまざまなサブグループ(サイズとタイプに基づく)の検査の前後で、観測されたエラー率に統計的に有意な差があるかどうかを確認するために、いくつかの簡単なテストを実行するように依頼されました。たとえば、Rでデータが次のように見える前と後の両方でデータが大幅に歪んでいたため、T検定は失敗しました。

summary(errorsBefore)
# Min.  1st Qu.  Median   Mean  3rd Qu.    Max
# 0.000  0.000    4.000  12.00    13.00  470.0

(これらは構成されています-所有権/プライバシーの問題により、実際のデータやデータの実際の操作を投稿することはできません-すみません!)

ペアの差は一元化されましたが、まだ正規分布にあまりよく適合していません。差分データは次のようになります。

summary(errorsBefore-errorsAfter)
# Min.   1st Qu.  Median   Mean  3rd Qu.    Max
# -110.0  -2.000   0.000  0.005   2.000   140.0

私はWilcoxonの符号付き順位検定を使用することが提案され、?wilcox.testとWikipediaを少しの間調べた後、これは使用する検定のようです。上記の仮定を考慮すると、データ生成プロセスを考えると、(1)は問題ないと考えています。仮定(2.a)は私のデータには厳密には当てはまりませんが、ここでの議論:分布が連続的でない場合のウィルコクソン検定の代替? これはそれほど心配ではないことを示しているようです。仮定(3)は問題ありません。私の唯一の懸念(私は信じます)は仮定(2.b)です。

1つの注意は、いくつかの年後、私は最終的にはもちろん、優れたノンパラメトリック統計を取って、順位和検定に多くの時間を費やしました。仮定(2.a)に埋め込まれているのは、「各Ziは同じ連続した母集団に由来する」であり、両方のサンプルは等しい分散を持つ母集団からのものであるという考えです。これは、実際には非常に重要であることがわかります。母集団(サンプルの抽出元)の差異の違いについて懸念がある場合は、WMWの使用について心配する必要があります。


2つの答えをありがとう!彼らはどちらも私を助けてくれました。できれば「両方を選んだ」と思います。マイクは理論的な理解の一部に私を向けました、それはアニコが私の元の質問にもう少し直接答えていたとしても、概念的に非常に役に立ちました。二人ともありがとう!
CompEcon 2011

回答:


8

ウィキペディアは、「... xとyの両方が指定され、ペアがTRUEである場合、ヌルのウィルコクソン符号順位検定でx-yの分布...ミューについて行われます。」

このテストでは、のRANK-TRANSFORMED値が、帰無仮説で指定した中央値を中心に対称であるかどうかを判断します(ゼロを使用するとします)。ほとんどのノンパラメトリック検定と同様に、符号付きランク検定は「配布なし」であるため、歪度は問題ではありません。多くの場合、これらのテストに支払う代償は消費電力の削減ですが、それを克服するのに十分な量のサンプルがあるようです。zi=xiyi

ランク合計テストの「一体何を」代替手段は、これらの測定値が対数正規分布に従うおおよそのオフチャンスでやような単純な変換を試すことです。値は「ベルカーブ」に見えるはずです。次に、テストで使用して、ランク合計テストが機能していることを自分(およびビジネス統計のみを取得した上司)に納得させることができます。これが機能する場合はボーナスがあります。対数正規データの平均のt検定は、元の変換されていない測定値の中央値の比較です。ln y iln(xi)ln(yi)

私?私は両方を実行し、他に私が調理できることは何でもします(企業サイズ別のポアソンカウントの尤度比テスト?)。仮説テストはすべて、証拠が説得力があるかどうかを決定することに関するものであり、一部の人々は、説得力のある山を取ります。


ああ、それはとても理にかなっています。特に、家に帰って、古いDeGroot&Schervishの教科書を取り出しました。これらの教科書には、これらの符号テストが実際に何をしているのかがわかりやすく説明されています。素晴らしい。そして、仮説検定に関する一般的な考えに感謝します:)私はその見方が好きです。マイナーなメモ:誤解を招くと指摘する部分は、実際にはwilcox.testのドキュメントのRからのものです。これは私にとって少し不安です...
CompEcon 2011

9

ウィキペディアとRのヘルプページはどちらも正確で、同じことを述べようとしています。

ウィキペディアの記事では、仮説は(中央値= 0)対(中央値!= 0)であり、差が対称的な分布(+その他の仮定)の場合、検定からこれを結論付けることができると述べています。

Rのヘルプページはより具体的であり、仮説は(中央値= 0であり、差は対称的な分布を持っている)対(少なくとも1つは偽である)と述べています。したがって、仮定を帰無仮説に移動しました。彼らは対称性の必要性を強調するためにこれを行ったと思います:歪んだ差では、符号付き順位検定は中央値が不確定であっても帰無仮説を棄却します。教科書を読んだ場合、テストされている帰無仮説がP(X> Y)= 0.5であることがわかるかもしれません-残りは実際にはこれに従うだけです。

適用に関して、問題はもちろん、中央値を特に重視するかどうか(そして、歪度が問題であり、中央値検定が可能な代替案であるか)、または分布全体を重視するかどうか、そしてP(X> y)!= 0.5は変更の証拠です。


1
わかりました、これは理にかなっています。入力ありがとうございます!中央値検定のWikipediaページで、ペアになっていないMann-Whitney-U検定のほうが望ましいと述べています。これはすぐに、自分が最初に戻ったような気がします。ペアのウィルコクソン検定はどういうわけかより多くの情報を使用していると思います。おそらく、私が本当に考えようとしているのは、「中央値または分布全体について特に気にかける」と言うときの意味でしょう。私は..全体の分布を気にしますが、中央値を通してそれを特徴づけるています
CompEcon
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.