メタ分析には多数の研究が含まれており、そのすべてで0.05を超えるP値が報告されています。全体的なメタ分析で0.05未満のP値を報告することは可能ですか?どんな状況で?
(答えはイエスだと確信していますが、参照または説明が欲しいです。)
メタ分析には多数の研究が含まれており、そのすべてで0.05を超えるP値が報告されています。全体的なメタ分析で0.05未満のP値を報告することは可能ですか?どんな状況で?
(答えはイエスだと確信していますが、参照または説明が欲しいです。)
回答:
個々の研究の結果は重要ではないかもしれませんが、一緒に見ると、結果は重要である可能性があります。
理論的には、研究結果を他のランダム変数と同様に処理することで続行できます。
してみましょういくつかのランダムな変数(例えば、研究から推定すること)。次に、が独立で場合、次の方法で一貫して平均を推定できます。
さらに仮定を追加して、を推定値分散とします。次に、逆分散重み付けでを効率的に推定できます。
これらのいずれの場合でも、個々の推定値がそうでなくても、はある信頼水準で統計的に有意である可能性があります。
もしその後、メタ分析はに収束しないことがあり(つまりメタ分析の平均が矛盾推定量です)。
たとえば、否定的な結果の公開に偏りがある場合、この単純なメタ分析は恐ろしく一貫性がなく、偏っている可能性があります!それは、コインフリップがテールを着地させなかったフリップを観察するだけで、ヘッドが着地する確率を推定するようなものです!
とは独立していない場合があります。たとえば、2つの研究とが同じデータに基づいている場合、メタ分析でとを独立として扱うと、標準誤差が大幅に過小評価され、統計的有意性が誇張されます。推定値は依然として一貫していますが、標準誤差は研究の相互相関を合理的に説明する必要があります。 i j y i y j
(1)と(2)を組み合わせることは特に悪いことです。
たとえば、投票をまとめて平均化するメタ分析は、個々の投票よりも正確である傾向があります。ただし、ポーリングをまとめて平均化することは、依然として相関エラーに対して脆弱です。過去の選挙で出てきたのは、若い出口調査員が高齢者ではなく他の若者にインタビューする傾向があるということです。すべての出口ポーリングで同じエラーが発生する場合、悪い推定値があり、それが適切な推定値であると思われる可能性があります(出口ポーリングは、同じアプローチを使用して出口ポーリングを実行し、このアプローチは同じエラーを生成するため、相関しています)。
間違いなくメタ分析に精通している人は、より良い例、より微妙な問題、より洗練された推定技術などを思い付くかもしれませんが、これは最も基本的な理論のいくつかと大きな問題のいくつかに到達します。異なる研究が独立したランダムなエラーを作成する場合、メタ分析は非常に強力です。調査全体でエラーが系統的である場合(たとえば、全員が年配の有権者を過小評価するなど)、調査の平均もオフになります。相関関係のある研究または相関関係のあるエラーを過小評価すると、効果的に集計サンプルサイズを過大評価し、標準誤差を過小評価します。
また、一貫した定義などのあらゆる種類の実用的な問題があります...
はい。N個の独立したスタディからN p値があるとします。
フィッシャーのテスト
(編集-以下の@mdeweyの有用なコメントに応じて、異なるメタテストを区別することが重要です。以下でmdeweyが言及した別のメタテストのケースを説明します)
古典的なフィッシャーメタ試験(参照"研究労働者のための統計的方法"、フィッシャー(1932) )統計 有するχ 2 2 Nのヌル分布を、よう- 2 LN (U )〜χ 2 2均一RV用U。
ましょう示す(1 - α ) -quantileのヌル分布。
すべてのp値がに等しいとします。ここで、おそらくc > αです。次いで、F = - 2 NのLN (C )及びF > χ 2 2 N(1 - α )C < EXP ( - χ 2 2 N(1 - α ) たとえば、α=0.05およびN=20の場合、個々のp値は以下でなければなりません
> exp(-qchisq(0.95, df = 40)/40)
[1] 0.2480904
もちろん、メタ統計テストでは、個々のヌルがすべて真である「集約」ヌルのみが「唯一」であり、ヌルのうち1つだけが偽であるとすぐに拒否されます。
編集:
ここに対して「許容」p値のプロットである、ことを確認するcがで育つNはそれにオフレベルと思われるが、C ≈ 0.36。
Iは、上部の変位値行き見出さ分布 χ 2 2 N(1 - α )≤ 2 N + 2 ログ(1 / α )+ 2 √ここで、その示唆χを 2 2 N(1-α)=O(N)となるよう EXP( - χ 2 2 N(1 - α )
逆正規検定(Stouffer et al。、1949)
検定統計量はZ = 1で与えられます とΦ-1標準正規分位関数。大きな負の値のテスト不良、すなわち、もし。Z<-1.645でα=0.05。したがって、pi=cの場合、Z=√
is already less than .
It is possible to work out the critical value and for example if we have ten primary studies each with a -values of 00.05 so as close to significant as can be then the overall critical value is 0.40. The method can be seen as a special case of Wilkinson's method which uses for and in fact for the particular set of primary studies even is not significant ()
L H C Tippett's method is described in a book The methods of statistics. 1931 (1st ed) and Wilkinson's method is here in an article "A statistical consideration in psychological research"