多重比較文献における「依存」テストと「独立」テストの平易な言葉の意味は?


18

家族ごとのエラー率(FWER)と誤発見率(FDR)の両方の文献で、FWERまたはFDRを制御する特定の方法は、依存テストまたは独立テストに適していると言われています。たとえば、1979年の論文「A Simple Sequentially Rejective Multiple Test Procedure」では、ホルムはステップアップシダック法とステップアップボンフェローニ制御法を対比するために次のように書いています。

テスト統計が独立している場合、同じ計算上の単純さが得られます。

BenjaminiとHochbergによる「偽発見率の制御」(1995)で、著者は次のように書いています。

定理1のための独立した検定統計量及び偽ヌル仮説の任意の構成のために、上記の手順コントロールFDRにおいて。q

その後、2001年に、ベンジャミニとイェクティエリは次のように書いています。

1.3。問題。実際にはFDRのアプローチを使用しようとすると、依存テスト統計はより頻繁に遭遇している独立したもの、その好例であること上記の複数のエンドポイントの例。

これらの著者は、扶養家族のどの特定の意味を使用していますか?テストが明確な言語の説明を伴う場合、テストを相互に依存または独立させるものの正式な定義に満足しています。

考えられるいくつかの異なる意味を考えることができますが、もしあれば、それらは次のようになるかもしれません:

  • 「従属」とは、多変量検定(つまり、同じまたは類似の予測子を持つ多くの従属変数)を意味します。独立とは、単変量テスト(つまり、多くの独立変数、1つの従属変数)を意味します。

  • 「依存」とは、ペアになった/一致した被験者に基づくテスト(ペアになったt検定、反復測定ANOVAなど)を意味します。「独立」とは、対応のない/独立したサンプル研究デザインを意味します。

  • 「依存」とは、テストが拒否される確率が別のテストが拒否される確率と相関することを意味し、「正の依存」とは、この相関が正であることを意味します。「独立」とは、拒否確率が無相関であることを意味します。

参照
Benjamini、Y。およびHochberg、Y。(1995)。誤検出率の制御:複数のテストに対する実用的かつ強力なアプローチ王立統計学会誌。シリーズB(方法論)、57(1):289–300。

Benjamini、Y。およびYekutieli、D。(2001)。依存関係にある複数のテストでの偽発見率の制御統計学年報、29(4):1165–1188。

ホルム、S。(1979)。単純な連続的に拒絶する複数のテスト手順Scandinavian Journal of Statistics、6(65-70):1979。


1
検定統計量はランダム変数です。このコンテキストでの「独立」は、任意のランダム変数のセットに対してまったく同じ意味を持ちます。
whuber

@whuberに感謝して、それを答えに増幅したいと思いますか?:)
アレクシス

回答:


13

「多重比較」とは、複数のテストの結果に基づいて意思決定を行うという一般的な問題に付けられた名前です。この問題の性質は、有名なXKCDの「Green jelly bean」漫画によって明らかにされています。この漫画では、調査者が(20色の)ゼリー豆の消費とにきびの関連性の仮説テストを実行しました。1つのテストでは、未満のp値が報告され、「インゲンマメがニキビを引き起こす」という結論に至りました。冗談は、p値は、設計によって、持っているということである未満であることのチャンス、そう直感的に我々は考え期待 p値を参照することの間で低いの異なるテスト。1/201/201/2020

漫画が言っていないのは、テストが別々のデータセットに基づいていたのか、1つのデータセットに基づいていたのかということです。20

201/202010.05200.3610.36=0.64

場合結果をもとにしていた一般的なデータセットが、前の計算が誤って次のようになります。それは、すべての前提の結果は統計的に独立しました。しかし、なぜそうならないのでしょうか?分散分析は標準的な例を提供します。2つ以上の治療グループを対照グループと比較する場合、比較には同じ対照結果が含まれます。比較は独立していません。現在、たとえば、コントロールの偶然の違いにより、「重要な」違いが生じる可能性があります。このような変動により、すべてのグループとの比較が同時に変更される可能性があります。2020

(ANOVAは、全体のF検定によってこの問題を処理します。「すべてを支配する」比較のようなものです。最初にこのF検定が重要でない限り、グループ間の比較は信頼しません。)

p1p2pnnn

独立したランダム変数の共同分布は、計算が簡単です。したがって、文献はこの状況と非独立の場合を区別しています。

したがって、引用における「独立」の正しい意味は、独立したランダム変数の通常の統計的な意味です。


nバツ1バツmμμ=0p1μ=1p2p1p2。この場合、そのようなことはまったくあり得ません!したがって、統計的独立性という概念は、時には当てはまらないことさえあります。


+1ありがとう、whuber!ANOVAは、例えば、そのケースであろう任意のすべての可能な対が試験されるANOVAを以下ペアワイズ比較は、「依存性」であろう、またはだけケース1つのグループが他の選択と比較されますか?(前者だと思うが、確認したい)。
アレクシス

2
ANOVAでは、残差の分散はすべてのデータから推定されます。したがって、何らかのだけが理由であれば2つの比較は、比較が共通で何基を有していない場合でも、(わずかに)依存することになります。比較に共通のグループ(「A」と「C」および「B」と「C」など)がある場合、依存関係はより明確で明確になります。
whuber
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.