Wilcoxonテストの漸近的な相対的効率が、正規分布データのスチューデントのt検定と比較されるのはなぜですか?


13

Wilcoxonの符号付きランク検定の漸近相対効率(ARE)は、データが正規分布の母集団から引き出される場合、スチューデントのt検定と比較してことはよく知られています。これは、基本的な1サンプルテストと2つの独立したサンプルのバリアント(Wilcoxon-Mann-Whitney U)の両方に当てはまります。また、通常のデータのANOVA Fテストと比較したクラスカルワリステストのAREです。3π0.955

この驚くべき(私にとっては、「最も予期しない外観のπ 1つ」)と驚くほど単純な結果は、洞察力に富んだ、驚くべき、または単純な証拠を持っていますか?


外観を考える正規累積分布関数で、外観 AREでは実際にあってはならないすべてのことは、驚くべきこと。私は答えを危険にさらしますが、良いものを作るには時間がかかります。ππ
グレン_b-モニカの復帰14

1
@Glen_b確かに-「統計にが多く表示される理由」の議論(CVにあったかどうかは覚えていませんが)と「正規分布のせいで」という議論を見てきました。、しかし、は初めて見たときでも驚くほど驚くべきものです。比較のために、マンホイットニーと2サンプルt検定のAREは、指数データで3、二重指数で1.5、均一で1-はるかに丸い!π3/π
シルバーフィッシュ14

1
@Silverfish van der Vaartの197ページ「漸近統計」をリンクしました。1標本の場合、符号検定はt検定と比較してです。2/π
ハシャー

1
@Silverfish ...そしてロジスティックではです。を含むよく知られたARE(1つまたは2つのサンプルの場合)のかなりの数と、整数の単純な比率であるかなりの数があります。(π/3)2π
グレン_b-モニカの復活14

1
1サンプルの符号付きランクテストの場合、です。1サンプルの符号検定では、です。それで、私たちは自分の立場を明確にしました。良い兆候だと思います。3/π2/π
ハシャー14

回答:


10

1サンプル検定、署名付き検定、および符号付きランク検定のAREの簡単なスケッチt

@Glen_bの回答の長いバージョンには、AREの直感的な説明とともに、2サンプルの符号付きランクテストの詳細な分析が含まれていると思います。そのため、ほとんどの派生をスキップします。(1サンプルの場合、欠落している詳細はLehmann TSHで見つけることができます)。

テスト問題:レッツロケーションモデルからランダムサンプルであっても、F X - θ がゼロを中心に対称、。私たちは、コンピューティングにある、署名テストのであるという仮説のためにランク検定を締結したH 0θ = 0 t検定に関連し。X1,,Xnf(xθ)H0:θ=0

テストの相対的な効率を評価するために、一貫したテストには固定の代替に対して1の傾向があるため、ローカルの代替のみが考慮されます。自明でない漸近パワーに与える上昇は、多くの場合、フォームであることを現地の選択肢いくつかの文献ではピットマンドリフトと呼ばれる、固定hの nθn=h/nh

今後の課題は

  • nullの下で各検定統計量の限界分布を見つける
  • 代替の下で各検定統計量の限界分布を見つける
  • 各テストの局所漸近力を計算する

テストの統計と漸近

  1. t検定(の存在が与えられた場合t n = σt n =
    tn=nX¯σ^dN(0,1)under the null
    tn=nX¯σ^dN(h/σ,1)under the alternative θ=h/n
    • 試験ように拒否した場合漸近電力機能を有する 1 - Φ Zのα - H 1tn>zα
      1Φ(zαh1σ)
  2. 符号付きテストSn=1ni=1n1{Xi>0}
    n(Sn12)dN(0,14)under the null 
    および局所漸近電源有する 1 - Φ Z α - 2 時間、F 0
    n(Sn12)dN(hf(0),14)under the alternative 
    1Φ(zα2hf(0))
  3. 符号付きランク試験W N D N 2 H F 21
    Wn=n2/3i=1nRi1{Xi>0}dN(0,13)under the null 
    および局所漸近電源有する 1 - Φ Z αを -
    WndN(2hf2,13)under the alternative 
    1Φzα12hf2

したがって、 A R E W n=

ARESn=2f0σ2
場合、fは標準正規密度であり、ARESN=2/πAREWN=3/π
AREWn=12f2σ2
fARESn=2/πARE(Wn)=3/π

場合均一である[-1,1]は、A R E S nが= 1 / 3A R E W N= 1 / 3fARE(Sn)=1/3ARE(Wn)=1/3

代替案の下での分布の導出に関する注意

もちろん、代替の下で制限分布を導き出す多くの方法があります。一般的なアプローチの1つは、Le Camの3番目の補題を使用することです。それの簡易バージョンは述べています

してみましょう尤度比の対数こと。いくつかの統計の W N、もし W NΔ ND N [ μ - σ 2 / 2σ 2 W τ τ σ 2 / 2 ]ΔnWn

(Wn,Δn)dN[(μσ2/2),(σW2ττσ2/2)]
帰無仮説の下では、その後、
WndN(μ+τ,σW2)under the alternative

cov(Wn,Δn)Δn

Δnhni=1nl(Xi)12h2I0
lI0Sn
cov(n(Sn1/2),Δn)=hcov(1{Xi>0},ff(Xi))=h0f=hf(0)

+1それほど詳細に説明するつもりはありませんでした(実際、あなたの答えはすでに十分にカバーされているので、おそらく今は何も追加しません)。 tアカウントを控える。それはあなたが来て良いことだので、私は、数日はまだ(とまだあなたがすでに持っている未満のため)されていると思います。
Glen_b -Reinstateモニカ

これは、特にLe Camの補題(+1)を追加するのに適した回答です。私には、1、2、および3の漸近線を確立することと、AREを記述する「そのための」ビットとの間にかなり大きなジャンプがあるように思えます。これを書いているとしたら、この時点で漸近効率を定義すると思います(または、それより前の時点で、ポイント1、2、および3のアップショットは、それぞれの場合に局所漸近力だけでなくAEになります) AREへのアクセスは、今後の読者にとってずっと容易になります。
シルバーフィッシュ

H1

回答を自由に編集するか、OPに追加してください。
ハシャー

1

6

πtYtnπ3

n <- 1000000; x <- qnorm((1:n)/(n+1)); cor(1:n, x)^2; 3/pi
[1] 0.9549402
[1] 0.9549297
n <- 100000000; x <- qnorm((1:n)/(n+1)); cor(1:n, x)^2; 3/pi
[1] 0.9549298
[1] 0.9549297

これは確かに非常に役立つコメントです。概念的にやや近いですかn <- 1e6; x <- rnorm(n); cor(x, rank(x))^2(明らかに同じ結果になります)?
シルバーフィッシュ

(フランクのコメントに興味を持っている人は、ウィルコクソン-マン-ホイットニーUの等価性とランクのt検定に関するこの質問を見たいと思うかもしれません。)
シルバーフィッシュ

nnn

私の記憶では、ウィルコクソンの符号付きランク検定とWMWの両方の小さなサンプル効率は、正規分布でのシフト代替の漸近値よりも少し低くなっています。
Glen_b-モニカの復活

5

12σ2[f2(x)dx]2fσ

f2f1ππ

同じ用語-同じ積分で-は、符号付きランクテストのAREに関係するため、同じ値を取ります。

4σ2f(0)2f(0)2π

π

参照:

JLホッジスとELレーマン(1956)、
「t検定のいくつかのノンパラメトリック競合の効率」、
アン。数学。統計学者。27:2、324-335。


π

f2dバツ

α=2
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.