Wilcoxonの符号付き順位検定は、t検定または符号検定のどちらよりも望ましい状況ですか?


10

いくつかの議論(下記)の後、焦点の合った質問のより明確な画像が得られたので、ここに改訂された質問がありますが、コメントの一部は元の質問と関係がないように見えるかもしれません。

と思われるt検定は、対称分布のために迅速に収束することを、符号付き順位検定は、対称性を仮定し、そしてそれは、対称的な分布のために、手段/ pseudomedians /中央値の間に違いはありません。もしそうなら、どのような状況下で、比較的経験の浅い統計学者は、t検定と符号検定の両方を利用できるときに、符号付き順位検定が役立つと思いますか?私の(例えば社会科学)生徒の1人が、ある治療が別の治療よりも優れているかどうかをテストしようとしている場合(比較的簡単に解釈される測定、たとえば、「平均」差の概念によって)、署名する場所を見つけるのに苦労しています-私の大学では、一般的に教えられているように見えますが、ランクテストは無視されています。


1
Justme:もちろん、私はそれについては考えていませんでした。
JonB

1
それは、あなたが見ている従来の知恵に依存します。私の経験はあなたのものとは大きく異なります。確かに、ヌルの下では差異スコアの対称性が想定されている(そして重要である)ことを明確に述べているリソースを見つけるのは簡単です。ただし、これはnullの下にあることに注意してください-結果として、サンプルの差分スコアに対称性の欠如が見つかるとは必ずしも関係ありません-代替の下で対称性を持っている必要はありません。nullがtrueの場合に対称性が保たれると確信している場合-そして多くの場合それは非常にもっともらしい仮定です-... ctd
Glen_b -Reinstate Monica

1
ctd ...問題はありません。問題は、事前に想定する準備ができていない場合、拒否が想定の失敗によって引き起こされたかどうかがわからないことです。そのとき明白なことは、単にそれを仮定しないことです。
Glen_b-モニカを回復2016

2
2番目のコメントを最初に見てください:(すでに述べた内容に加えて)、次の点に注意してください。1.通常の仮定はパラメトリックテストを使い果たしません。2.符号付き順位検定は、実際には中央値の検定ではなく、1サンプルのホッジス-レーマン統計/疑似中央値の検定です(対称性の仮定を代替案に追加すると、中央値も検定され、平均が存在する場合は、他の手段の中でも特に、手段について)。同様に、順位和検定は中央値の検定ではなく、ペアワイズ差の中央値の検定です。符号付き順位検定のレベルは、非対称性に非常に敏感である可能性があるというのは、あなたの言う通りです。
Glen_b-モニカを復活させる'23 / 11/16

2
以前のコメント:1対称性は、通常、nullの一部とは見なされませんが、nullの下で順列を交換できるようにするために必要な仮定の一部として。2.前述のように、これは実際には中央値のテストではなく、疑似中央値のテストであり、これは非対称の代替手段の下でも当てはまります。制限的な仮定を行うと解釈が容易になることもありますが、中央値の妥当な検定を行うために必要な制限は、代替法の下で対称性を仮定するほど厳密である必要はありません。
Glen_b-モニカを復元する

回答:


3

通常よりもやや重いテール付きのペア差の分布を考えますが、特に「ピーク」ではありません。その場合、符号付きランク検定は、t検定よりも強力になる傾向がありますが、符号検定よりも強力になる傾向があります。

たとえば、ロジスティック分布では、t検定に対する符号付きランク検定の漸近相対効率は1.097であるため、符号付きランク検定はtよりも強力です(少なくとも大きなサンプルでは)が、漸近相対効率はt検定に関連する符号検定の0.822であるため、符号検定はtよりも強力ではありません(ここでも、少なくとも大きなサンプルでは)。

重い分布に移行すると(ピークが極端な分布を避けながら)、tは比較的悪くなる傾向がありますが、符号テストは多少改善され、符号と符号ランクの両方がtを上回って小さな検出をします大幅なマージンによる影響(つまり、影響を検出するために必要なサンプルサイズがはるかに小さくなる)。符号付きランク検定が3つのうち最良である、大きなクラスの分布があります。

これが1つの例ディストリビューションです。電力は、5%の有意水準で、3つのテストに対してn = 100でシミュレーションされました。検定の検出力は黒でマークされ、ウィルコクソンの符号付きランクは赤で、符号検定は緑でマークされます。符号検定の利用可能な有意水準には特に5%近く含まれていなかったため、その場合、ランダム化検定を使用して正しい有意水準に近づけました。x軸は、ヌルケースからのシフトを表すパラメーターです(テストはすべて両側であったため、実際の電力曲線は0に関して対称になります)。t3tδ

tの検出力曲線のプロット、n = 100、t3の有意水準5%のWilcoxon符号付きランクおよび符号検定

プロットからわかるように、符号付き順位検定は符号検定よりも強力であり、t検定よりも強力です。


この@Glen_bに感謝します!力の概念さえも彼らの研究の範囲を超えている学生がいるとき、そして私たちがなぜペアのtの主な代替手段としてウィルコクソンを教えるのか、私はシラバスに適合する場所を見つけるのにまだ苦労しています。しかし、これはいくつかの有用な動機を与えます。ありがとうございました!
justme

ちなみに、どの分布特徴が中央値の漸近分散に影響を与えるか(したがって、符号検定の検出力)を検討した後、tと符号検定の相対位置が逆になる例が発生しました。結果として、符号付きランクテストが他の2つのテストのどちらよりもかなり良いケースを構築する可能性は十分にあると思います。できれば、もう少し遊んだり、何か書いたりするかもしれません。
Glen_b-モニカの復活2017

あなたのシラバスに関しては、符号付きランクが他の両方のテストよりも優れているケースが確かにあります(私の回答で概説したように、分布は通常よりもやや重いが、特にピークではない分布です)。tは通常またはより明るいときに良くなり、符号検定は分布に強いピークがある場合によくなります(非常に重い裾を伴う傾向がありますが、そうである必要はありません)。[ただし、これらのアイデアをスプレッドの単なる変更と混同して、相対的なプロパティを変更しないことに注意してください。] ...そのような文をいくつか絞ることはできると思います
Glen_b -Reinstate Monica

本当にありがとう@Glen_b!問題は、私がシラバスを教えるのではなく、それをサポートすることです!ほとんどの学部のシラバスは次のように思われます:(i)正常性の仮説検定を使用し(今は私を殺します)、それに基づいて(ii)Wilcoxonまたはt検定を使用します。したがって、分布の肩などの細部に触れたり、仮定が満たされているかどうか(わずかにゴミの方法で)が影響を受けたりすることはありません。しかし、あなたの考えは、少なくとも個人的には非常に役に立ちます。
justme

素晴らしい投稿@Glen_b!では、2つのテストから選択するという点では、常に最初に電力を計算する必要があると結論付けられますか?差分分布が正規でない場合に常に符号検定を使用するという仮定に従うのではなく、ありがとう!
-Lumos、
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.