ストーファーのZスコア法:我々は合計あれば何の代わりに、?


22

同じ帰無仮説でN独立した統計検定を実行していますが、結果を1つのp値に結合したいと思います。Fisherの方法とStoufferの方法の 2つの「受け入れられた」方法があるようです。

私の質問は、ストーファーの方法についてです。個別のテストごとに、zスコアz_iを取得しzます。帰無仮説では、それらはそれぞれ標準正規分布で分布するため、和Σzは分散Nの正規分布に従いますN。したがって、Stoufferの方法は、単位分散で正規分布する\ Sigma z_i / \ sqrt {N}を計算しΣz/N、これをジョイントzスコアとして使用することを提案しています。

これは理にかなっていますが、ここで私が思いついた別のアプローチがあり、これも理にかなっています。各zは標準正規分布に由来するため、平方和S=Σz2N自由度のカイ2乗分布に由来する必要があります。したがって、N自由度の累積カイ2乗分布関数を使用してSを計算し、p値に変換できます(p = 1−X_N(S)X_NはCDF)。Np=1バツNSバツN

しかし、このアプローチが言及されていることすら見つけることができません。使用されたことがありますか?名前はありますか?ストーファーの方法と比較した場合の利点/欠点は何ですか?または、私の推論に欠陥がありますか?


飛び出している顕著な欠陥の1つは、Stoufferの方法がz_iの体系的なシフトを検出できることzです。速いシミュレーション(N=100104回の反復)がこの場合であることを示しています。カイ二乗法は、真剣に、片側の代替を検出するために、それほど強力。
whuber

2
ありがとう、whuber!シミュレーションについて詳しく説明してください、私は興味があります。一方、z符号が異なるが絶対値が大きい場合、Stoufferの方法は全体でz0になる可能性がありますが、私の方法では非常に有意なpが報告されpます。場合によってはもっと意味があると思います(私の場合はそうなると思いますが、わかりません)。
アメーバは、モニカを復活させる

1
あなたは正しい。だからこそ、答えとしてコメントを投稿しなかった。しかし、偶然による場合を除いて両方向でヌルとは根本的に異なる選択肢はどのような状況にありますか?
whuber

私が念頭に置いていた状況は、Pearsonのカイ2乗検定のようなもので、経験的分布がヌルと異なるかどうかに関心があります。その後、どちらの方向の偏差も重要です。しかし、考え直した後、あなたの直感は正しいと思います。私の場合、疑わしい逸脱はすべて一方向にあります。コメントを回答として投稿し、クイックシミュレーションの詳細を提供していただいた場合(カイ2乗法がなぜそれほど強力ではないのか非常に興味があります!)、喜んで受け入れます。
アメーバは、モニカを復活させる

n個のZスコアの合計は、n?なぜ分散は平均の標準誤差の二乗ではないのですか?タイトルで暗示されているの合計には、Nの分散があります。Z2
russellpierce

回答:


17

飛び出す欠点の1つは、Stoufferの方法がシステマティックシフトを検出できることです。簡単なシミュレーションにより、これが事実であることがわかります。カイ二乗法は、片側の代替案を検出するのにそれほど強力ではありません。ここで(赤=ストーファー、青=カイ二乗)のための両方の方法によるp値のヒストグラムでと独立した反復回数と各種片面標準効果なしの範囲は、()スルー SD()。z105N=10μμ=00.6μ=0.6

図

より良い手順では、ゼロに近い領域が増えます。示されているすべての正の値に対して、その手順はストーファー手順です。μ


Rコード

これには、比較のためのフィッシャーの方法(コメント化)が含まれます。

n <- 10
n.iter <- 10^5
z <- matrix(rnorm(n*n.iter), ncol=n)

sim <- function(mu) {
  stouffer.sim <- apply(z + mu, 1, 
                    function(y) {q <- pnorm(sum(y)/sqrt(length(y))); 2*min(q, 1-q)})
  chisq.sim <- apply(z + mu, 1, 
                    function(y) 1 - pchisq(sum(y^2), length(y)))
  #fisher.sim <- apply(z + mu, 1,
  #                  function(y) {q <- pnorm(y); 
  #                     1 - pchisq(-2 * sum(log(2*pmin(q, 1-q))), 2*length(y))})
  return(list(stouffer=stouffer.sim, chisq=chisq.sim, fisher=fisher.sim))
}

par(mfrow=c(2, 3))
breaks=seq(0, 1, .05)
tmp <- sapply(c(0, .1, .2, .3, .4, .6), 
              function(mu) {
                x <- sim(mu); 
                hist(x[[1]], breaks=breaks, xlab="p", col="#ff606060",
                     main=paste("Mu =", mu)); 
                hist(x[[2]], breaks=breaks, xlab="p", col="#6060ff60", add=TRUE)
                #hist(x[[3]], breaks=breaks, xlab="p", col="#60ff6060", add=TRUE)
                })

再びありがとう、これはとてもいい。そして、フィッシャーの方法のコメントを外した場合はどうなりますか?すでに試したことがあると思います。ストーファーは常に勝ちますか?(自分で試していないことを申し訳ありませんが、Rの経験がなく、手元にありません。)
アメーバは、Reinstate Monica

更新:FisherとStoufferの方法の比較に関して、ここで素晴らしい議論を見つけました。主張は、Stoufferはヌルからの一貫した偏差に対してより敏感であり、Fisherは単一の(しかし大きな)偏差に対してより敏感であることです。あなたのシミュレーションでは、一貫した偏差(すべてのテストで同じ)があったと思いますか?テストのうち1つだけが大きな偏差を示した場合、どうなるのでしょうか。μNN
アメーバは、モニカを復活させる

1
Rこれをテストするために、シミュレーションを簡単に修正できます。この統計計算プラットフォームを紹介する良い方法です。:-)
whuber

2
matlabを使用してシミュレーションを再現しました。結論:すべてのが一貫して0から逸脱すると、StoufferはわずかなマージンでFisherに勝ち、 "my"メソッドは絶望的に(あなたが示したように)失います。 1つだけが0から大きく外れている場合、フィッシャーは「マイ」メソッドにわずかなマージンで勝ち、ストッファーは絶望的に負けます。zz
アメーバは、モニカを復活

素晴らしい議論とQA!1つの簡単な質問:マハラノビス距離を計算し、このような何かに従うことにより、この問題を外れ値/異常検出として形成するとどうなりますか?
NULL

10

テスト統計を洞察するための一般的な方法の1つは、そのテスト統計が最も強力になる(通常は暗黙的な)基礎となる仮定を導き出すことです。この特定のケースについて、学生と私は最近これを行いました:http : //arxiv.org/abs/1111.1210v2 (改訂版は、応用統計の年報に表示されます)。

非常に簡単に要約すると(別の回答のシミュレーション結果と一致するように)、「真の」基礎効果がすべて等しい場合、ストーファーの方法が最も強力になります。Z ^ 2の合計は、基礎となる効果が通常約0に分布している場合に最も強力になります。これは、詳細を省略するわずかな単純化です。詳細については、上記リンクのarxivプレプリントのセクション2.5を参照


2
(+1)どういうわけか私はずっと前にそれを書いたと思っていましたが、私はそうしなかったようです:私の質問に答えるためにここに登録してくれてありがとう!それは有り難いです。あなたの論文のセクション2.5は実際に非常に重要です。
アメーバは、モニカを復活させる14

3

わずかにo / t:これらの両方のアプローチに伴う問題の1つは、自由度に起因する電力の損失です(スーファーの場合はN、フィッシャーの場合は2N)。このために開発されたより優れたメタ分析アプローチがありますが、検討することをお勧めします(たとえば、逆分散加重メタ分析)。

グループ内でいくつかの代替テストの証拠を探している場合は、DonohoとJinのより高い批判の統計をご覧ください。https//projecteuclid.org/euclid.aos/1085408492


1

質問に答えるため、さらに読者のために:使用されたことがありますか?Cousins(2008)によるarXivに関する網羅的な論文があり、いくつかの代替アプローチをリストしてレビューしました。提案されたものは表示されないようです。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.