不等分散の下でのマンホイットニー帰無仮説

マンホイットニーのU検定の帰無仮説に興味があります。私はしばしば、帰無仮説が2つの母集団の分布が等しいという仮説であると述べたのを見ます。しかし、私は考えています。平均が同じで分散が非常に異なる2つの正常な母集団がある場合、マンホイットニー検定はおそらくこの違いを検出しません。

また、マンホイットニー検定の帰無仮説がまたは2番目の母集団からの観測（）を超える1つの母集団からの観測（）の確率（）（タイの除外）は0.5です。これはもう少し理にかなっているようですが、私が述べた最初の帰無仮説と同等ではないようです。 $\Pr(X>Y)=0.5$ $X$ $Y$

私はこれを解くのに少し助けが欲しいと思っています。ありがとう！

hypothesis-testing variance wilcoxon-mann-whitney

— ジム
ソース

回答:

マンホイットニー検定は、置換検定の特殊なケースであり（nullの下の分布は、データのすべての可能な置換を調べることによって得られます）、置換検定はnullを同一の分布として持つため、技術的には正しいです。

マンホイットニー検定統計量の考え方の1つは、あるグループからランダムに選択された値が他のグループからランダムに選択された値を超える回数の測定です。したがって、P（X> Y）= 0.5も意味があり、これは技術的には等分布nullのプロパティです（同順位の確率が0である連続分布を想定）。2つの分布が同じ場合、XがYよりも大きい確率は0.5です。これは、両方が同じ分布から抽出されているためです。

平均が同じであるが分散が大きく異なる2つの分布の前述のケースは、2番目の帰無仮説と一致しますが、同一の分布の1番目とは一致しません。シミュレーションを実行して、この場合のp値がどうなるかを確認できます（理論的には、p値は均一に分布しているはずです）。

> out <- replicate( 100000, wilcox.test( rnorm(25, 0, 2), rnorm(25,0,10) )$p.value )
> hist(out)
> mean(out < 0.05)
[1] 0.07991
> prop.test( sum(out<0.05), length(out), p=0.05 )

        1-sample proportions test with continuity correction

data:  sum(out < 0.05) out of length(out), null probability 0.05
X-squared = 1882.756, df = 1, p-value < 2.2e-16
alternative hypothesis: true p is not equal to 0.05
95 percent confidence interval:
 0.07824054 0.08161183
sample estimates:
      p 
0.07991

したがって、これは明らかに拒否する頻度が高く、帰無仮説は偽です（これは分布の等価性に一致しますが、prob = 0.5には一致しません）。

エフロンダイスに基づく母集団を比較する場合、X> Yの確率で考えると、いくつかの興味深い問題が発生します。

— グレッグ・スノー
ソース

こんにちはグレッグ、答えてくれてありがとうあなたが言っているように聞こえますが、等しい分布nullの下でテストが適切に機能しない特別なケースが少し見つかりました。さらに、私が述べた帰無仮説は等しくありません。あれは正しいですか？

— Jimj 2013

マン・ホイットニーは、同じ平均と分散の変化に敏感ではありませんが、それはすることができます-あなたが見るようにフォーム、リードという違いを検出から逸脱する（例えばここで、平均と分散の両方が一緒に増加します）。平均が等しい2つの法線がある場合、それらの差はゼロについて対称です。したがって、 $P(X>Y)=0.5$ $P(X>Y)$ $0.5$ 、これはヌル状況です。 $P(X>Y) = P(X-Y>0) = \frac{1}{2}$

たとえば、の分布が平均指数関数であるのに対し、は平均指数分布（スケールの変化）である場合、マンホイットニーはそれに敏感です（実際、両側のログを取ると、ロケーションシフト、およびマンホイットニーは単調変換の影響を受けません）。 $Y$ $1$ $X$ $k$

中央値が等しい場合のスプレッドの違いに敏感なマンホイットニーと概念的に非常に似ている検定に関心がある場合は、そのような検定がいくつかあります。

ありますシーゲル-テューキーテストとアンサリ-ブラッドリーテストは密接マン・ホイットニー・ウィルコクソン2つの標本検定に関連する両方は、例えば、。

どちらも、端からランクインするという基本的な考え方に基づいています。

Rを使用する場合、Ansari-Bradleyテストが組み込まれています... ?ansari.test

実際のSiegel-Tukeyは、サンプルから異なる方法で計算されたランクに対してマンホイットニーウィルコクソン検定を実行します。データを自分でランク付けする場合、p値用の個別の関数は実際には必要ありません。それにもかかわらず、ここにあるように、いくつかを見つけることができます：

http://www.r-statistics.com/2010/02/siegel-tukey-a-non-parametric-test-for-equality-in-variability-r-code/

（私の元の回答の下のttnphnsのコメントに関連して）

特に実質的な意味で@GregSnowに同意しないものとしてそれを読むと、私の応答を過度に解釈することになります。確かに強調点には違いがあり、話している内容にもある程度の違いがありますが、その背後に実際の意見の相違があったとしても、私は非常に驚きます。

$U$ $x$ $y$ $f=g$

$U$ $y$ $x$ $\frac{1}{2}$ $Y$ $X$

$U$ $X$ $Y$ $f=g$

$f=g$

私は、多くの状況でそれができると信じています。特に、あなたが説明するものよりも一般的である状況（同じ平均であるが非常に不均一な分散を持つ2つの正常な母集団は、ランクに基づいて結果の分布を変更せずにかなり一般化できる）、検定統計量の分布は派生元と同じディストリビューションであることが判明したため、そこで有効である必要があります。これをサポートしていると思われるシミュレーションをいくつか行いました。ただし、これは必ずしも非常に有用なテストではありません（電力が不足している可能性があります）。

$f=g$

それをあなたが何をするかで作ってください、しかし私はこれを@GregSnowとの実質的な不一致として解釈しません

参考-Mann＆Whitneyのオリジナル論文

— Glen_b-モニカの復活
ソース

WikipediaのMann-Whitneyトークページの次の言葉に同意することはできましたか

the null hypothesis of Mann-Whitney U-test is not about the equality of distributions. Is is about the symmetry between two populations with respect to the probability of obtaining a larger observation

。@Gregの答えに同意しませんか？

— ttnphns 2013

編集中にディスカッションを追加しました。

— Glen_b-モニカを

とてもいい追加。私はそれを勉強するつもりです（私はいつもMWテストにニュアンスがあり続けて私を逃れているように感じました）。一方、「MWテストの統計は平均ランクの（不等）のみを反映するため、f〜= g [f、gを元の分布、以前のランキングとして理解する]このテストは、f = gの場合と同じH0を扱い続けるため、完全に関連性があります。そのような状況の例は、拡散パラメーター（分散）を除いて完全に同一の対称分布です。

— ttnphns 2013

f

$f$

g

$g$

X

$X$

Y

$Y$