Rのwilcox.test()によるW統計の出力は、U統計と同じですか?


22

私は最近、Mann-Whitney Uテストについて読んでいます。Rでこのテストを実行するには、実際にWilcoxonテストを実行する必要があることがわかります!

私の質問:wilcox.testRのW統計はU統計と同じですか?

回答:


25

ウィルコクソンは、テストの最初の発明者*であると一般に信じられていますが、マンとホイットニーのアプローチは大きな前進であり、統計が集計されたケースを拡張しました。私の好みは、両方の貢献を認識するために、テストをウィルコクソン-マン-ホイットニーと呼ぶことです(マン-ホイットニー-ウィルコクソンも見られます;私も気にしません)。

*ただし、実際の写真はもう少し濁っており、他の何人かの著者も、今回またはそれ以前について同じまたは同様の統計を出したり、場合によってはテストに密接に関連した貢献をしています。クレジットの少なくとも一部は他の場所に行く必要があります。

Wilcoxon検定とMann-Whitney U検定は、同じ状況下で同じケースを常に拒否するという点で同等です(およびヘルプはそれらがそうであると述べています)。せいぜい、彼らのテスト統計は、シフト(そして場合によっては、単に符号の変化)だけが異なります。

ウィルコクソン検定は、文献で複数の方法で定義されています(そして、その曖昧さは、一瞬よりも、検定統計量の元の表にさかのぼります)。

この2つの投稿では、最も一般的な2つの定義形式について説明します。

Rのウィルコクソン順位和検定

Wilcoxon順位和検定の検定統計量を計算するさまざまな方法

Rで具体的に何が起こるかに対処するには:

wilcox.testRで使用される統計は、ヘルプ(?wilcox.test)で定義されており、Mann-Whitney U統計との関係の問題がそこで説明されています。

文献は、ウィルコクソンの順位和とマン・ホイットニー検定の定義について全会一致ではありません

最も一般的な2つの定義は、最初のサンプルのランクの合計に対応し、最小値が減算されるかどうか:Rは減算され、S-PLUSは減算されず、aに対してm(m + 1)/ 2サイズmの最初のサンプル。(ウィルコクソンの元の論文はランクの調整されていない合計を使用したようですが、後続のテーブルは最小値を引きました。)

Rの値は、すべてのペアの数として計算することができ(x[i], y[j])たためy[j]よりも大きくないx[i]、マン・ホイットニー検定の最も一般的な定義。

この最後の文はあなたの質問のその側面に完全に答えます-Rが出力するWのバージョンもUの値です。

n1n1+12


7

ウィルコクソンの順位和検定とマン・ホイットニー検定は、独立したt検定のノンパラメトリックな同等物です。場合によっては、Rが提供するWのバージョンはUの値でもあります。しかし、すべての場合ではありません。

使用する場合:wilcox.test(df$var1 ~ df$var2, paired=FALSE)指定されたWはUと同じです。したがって、Mann-Whitney U統計として報告できます。

ただし、を使用するwilcox.test(df$var1 ~ df$var2, paired=TRUE)場合、実際にはウィルコクソンの符号付きランクテストを実行しています。ウィルコクソンの符号付きランク検定は、従属t検定と同等です。

出典:Andy Field(2013)による「Rを使用した統計の発見」


1
引数を使用する場合paired=TRUE、ウィルコクソン-マン-ホイットニーではなく、署名されたランクであることに注意してください。
Glen_b-モニカの復職

1

ただし、次のコードに注意してください wilcox.test(df$var1 ~ df$var2, paired=FALSE)(「〜」を使用)

aとは異なるW統計を生成します:( wilcox.test(df$var1, df$var2, paired=FALSE)'、'を使用)


サイト@Tilenへようこそ。これは、OPの質問への回答、OPまたは回答者のいずれかからの明確化を要求するコメント、または独自の新しい質問として意図されていましたか?元の質問に対する回答を提供する場合にのみ、「あなたの回答」フィールドを使用してください。評価が50を超えると、どこでもコメントできます。新しい質問がある場合ASK QUESTION は、ページ上部の灰色をクリックして質問してください。その後、適切にサポートいたします。あなたはここに新しいので、あなたは、新しいユーザー向けの情報が記載されたツアーます。
GUNG -復活モニカ

@gungに感謝します。確かに、それは私が推測する答えと質問の両方でした。ヒントをありがとう。これに参加することを楽しみにしています。
Tilen

「回答」は、質問に対する直接的な回答のみを目的としています。これを編集して、より純粋な回答にすることができますか?
グン-モニカの復職

ごめんなさい 今編集しました。今では良く見えますか?
Tilen

1
謝る必要はありません。あなたの答えはあなたがここに書いたことに暗示されていると思いますが、人々は行の間を読む必要があります。あなたはそれを明確にし、それをすべて弓で縛ることができますか?ただし、これが正しいかどうかはわかりません。数式バージョンを使用するには、値のベクトルとグループ化インジケーターが必要です。例えば、wilcox.test(values~ind, with(df, stack(var1=var1, var2=var2)), paired=FALSE)。私がそれをするとき、私は同じW両方の方法を得る。
gung-モニカの回復
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.