Mann-Whitney U検定:効果サイズの信頼区間


13

フリッツ、モリス、及びRichler(2011;下記参照)によれば、式を使用してマン・ホイットニーU検定のための効果の大きさとして算出することができる これは便利であることを私、他の機会にもを報告します。効果の大きさの尺度に加えて、の信頼区間を報告したいと思います。r

r=zN
rr

私の質問は次のとおりです。

  • ピアソンのrのようにrの信頼区間を計算できますが、ノンパラメトリック検定の効果サイズの尺度として使用されますか?
  • 片側検定と両側検定の場合、どの信頼区間を報告する必要がありますか?

2番目の質問に関する編集:「片側検定と両側検定の場合、どの信頼区間を報告する必要がありますか?」

私は、私見がこの質問に答えるかもしれないいくつかの情報を見つけました。「両側の信頼限界は信頼区間を形成しますが、片側の信頼限界は信頼限界の下限または上限と呼ばれます。」(http://en.wikipedia.org/wiki/Confidence_interval)。この情報から、有意性検定(たとえば、)が片側か両側かは主な問題ではなく、影響の大きさのCIに関してどのような情報に関心があるかを結論付けます。私の結論(あなたが同意しない場合は私を修正してください):t

  • 両側CI 上限下限に関心(結果として、両側CIが0を伴う可能性がありますが、有意性の片側検定はp <.05でしたが、特に値が。 05.)
  • 片側の「CI」上限または下限にのみ関心がある(理論的推論による); ただし、これは必ずしも有向仮説をテストした後の主な関心事ではありません。エフェクトサイズの可能な範囲に焦点が当てられている場合、両面CIは完全に適切です。正しい?

上記の記事からのMann-Whitney検定の効果サイズの見積もりに関するFritz、Morris、&Richler(2011)の文章の一節については、以下を参照してください。

「ここで説明したエフェクトサイズの推定値のほとんどは、データが正規分布を持っていることを前提としています。ただし、一部のデータはパラメトリックテストの要件を満たしていません。通常は、Mann-WhitneyやWilcoxon検定などのノンパラメトリック統計検定を使用しますこれらの検定の有意性は、通常、標本サイズが小さすぎない場合の検定統計の分布を分布に近似することで評価されます。これらのテストを実行するSPSSなどのパッケージは、または値に加えて適切な値を報告します;zzうんTz手動で計算することもできます(例:Siegel&Castellan、1988)。値は、次のような、効果の大きさを計算するために使用され得るコーエン(1988)によって提案されました。Cohenのrに関するガイドラインでは、大きな効果は0.5、中程度の効果は.3、小さな効果は.1です(Coolican、2009、p。395)。、を計算するのは簡単ですzrrr2、又はこれらからZ値ので 、R = Zη2z および r2

r=zN
これらの効果サイズの推定値は、式にNが含まれているにもかかわらず、サンプルサイズに依存しません。これは、zがサンプルサイズに敏感だからです。Nの関数で除算すると、結果の効果サイズの推定値からサンプルサイズの効果が削除されます。 "(p。12)
r2orη2=z2N

回答:


9

Mann-Whitney Uテストの効果サイズの1つの選択肢は、共通言語の効果サイズです。Mann-Whitney Uの場合、これは所定の仮説をサポートするサンプルペアの割合です。

2番目の選択肢はランク相関です。ランク相関の範囲は-1〜+1であるため、ピアソンrと同様のプロパティがあります。さらに、単純な差分式により、ランク相関は、共通言語効果のサイズとその補数の違いであり、解釈を促進する事実です。たとえば、100個のサンプルペアがあり、70個のサンプルペアが仮説をサポートしている場合、共通言語効果のサイズは70%であり、ランク相関はr = .70 = .30 = .40です。共通言語の効果サイズとランク相関を計算する4つの式の明確な議論は、ジャーナルInnovative Teaching:Kerby(2014)Innovative TeachingのKerbyによって与えられています。

ちなみに、この論文では言及していませんが、Somers dとMann-Whitneyのランク相関は同等であると確信しています。


1
「たとえば、可能なペアが100個ある場合」という意味ですか?Mann-WhitneyのU検定はペアになっていないデータに対するものであるため、フレージングは​​曖昧です。読者に考えられるペアは何かを明確にすることができます。
GUNG -復活モニカ

1
コメントと明確にする機会をありがとう。サンプルペアを参照しました。実験サンプルに10個の観測値があり、コントロールサンプルに10個の観測値がある場合、10 * 10 = 100個のサンプルペアがあります。Robert Grissomによると、サンプルの効果サイズは母集団効果サイズの公平な推定量です。したがって、サンプルのランク相関がr = .40の場合、これは母集団効果サイズの不偏推定量です。
DSK

@DSK、それがあなたの言っていることだと思いました。その説明は人々に役立つと思います。あなたはそれをあなたの答えに編集したいかもしれません。CVへようこそ。
GUNG -復活モニカ

8

あなたのリンクは記事を購入する機会に私を導きます。

cHmiscrcorr.censcDバツyDバツy=2×c12


これを通知にご連絡いただきありがとうございます(リンク)。私は今、質問にマン・ホイットニー検定の文章を挿入しました。
グレー14年

ご回答どうもありがとうございました。c-indexとSomers 'Dの解釈方法についてのリンクが手元にある可能性はありますか?特に後者がrと同等に解釈できるかどうかに興味があります。2つのサンプルがあり、2番目のサンプル(大きいNと正規分布)でrを報告します。もちろん、使用される測定値が類似していれば、結果の比較が簡単になると思います。だからこそ、私はフリッツらが述べた式に興味がありました。(2011)。それで、ピアソンのrのように、rのCIは計算できませんか?どうもありがとう!
グレー14年

zDバツyYDc

ご回答ありがとうございます。私はサマーの解釈方法についてさらに情報を探しましたが、今のところあまり成功していません。SomerのdはPearsonの相関係数と同様に理解できますか?たとえば、2乗すると決定係数が得られますか?rが存在する場合は、rと同様に解釈できるエフェクトサイズの尺度を見つけることができて非常にうれしいです。
グレー14年

式r = Z /√(N)に関するさらなる情報を見つけました:Rosenthal(1991)は、「研究のサイズ(N)を知っている限り、pレベルのみから効果サイズrを有効に推定できる」と書いています。 Z値のテーブルを使用して、取得したpを標準の標準偏差に変換します。」
グレー14年
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.