あなたのコメントのために、私は2つの別々のセクションを作ります:
p値
統計的仮説検定では、対立仮説の「統計的証拠」を見つけることができます。帰無仮説の棄却に失敗した場合に続くことで説明したように、、数学の「矛盾による証明」に似ています。
したがって、「統計的証拠」を見つけたい場合は、H 1と呼ばれる証明しようとするもののを示す反対のものを仮定します。この後、サンプルを描画し、サンプルからいわゆる検定統計量(t検定のt値など)を計算します。H0H1
次に、が真であり、サンプルがH 0の下の分布からランダムに引き出されると仮定すると、(ランダム)サンプルから派生した値以上の値を観測する確率を計算できます。この確率はp値と呼ばれます。H0H0
この値が「十分に小さい」、つまり選択した有意水準よりも小さい場合、を拒否し、H 1が「統計的に証明された」とみなします。H0H1
この方法では、いくつかのことが重要です。
- が真であるという仮定の下で確率を導出しましたH0
- H 0の下で想定された分布からランダムなサンプルを取得しましたH0
- ランダムなサンプルから導出された検定統計量が超過する可能性が低い場合、H 1の証拠を見つけたと判断します。したがって、H 0が真である間に超過することは不可能ではなく、これらの場合、タイプIエラーが発生します。 H1H0
だから、タイプIエラーは何です:タイプIエラーがあった場合サンプル、無作為から引き出された、という結論につながるH 0は、実際に偽の間は、それは本当です。H0H0
これは、p値がタイプIエラーの確率ではないことを意味することに注意してください。実際、タイプIエラーはテストによる誤った決定であり、決定はp値を選択した有意水準と比較することによってのみ行うことができ、p値だけでは決定することはできません。決定が行われる選択された有意水準へのp値。決定が行われない限り、タイプIエラーは定義されません。
それではp値は何ですか?潜在的に間違って拒否、我々は下のランダムなサンプルを描くという事実によるものであるH 0、それは我々がサンプルを描画することによって、この「」運が悪い「」リードすることを「「」不運」を持っているかもしれませんので、H 0の誤った拒否に対して。そのため、p値(これは完全に正しいわけではありませんが)は、「不良サンプル」を描く確率に似ています。p値の正しい解釈は、H 0の下で無作為に抽出されたサンプルから導出された検定統計量の値を検定統計量が上回るか等しい確率です。H0H0H0H0
偽発見率(FDR)
上で説明したように、帰無仮説が拒否されるたびに、これを「統計的証拠」と見なします。そのため、新しい科学的知識を発見したため、発見と呼ばれます。また、上記で説明したように、タイプIエラーを作成すると、誤った発見(つまり、H 0の誤った拒否)を行うことができます。その場合、科学的真実の誤った信念があります。私たちは本当に本当のことだけを発見したいので、偽の発見を最小限に抑えようとします。つまり、タイプIエラーを制御します。タイプIエラーの確率が選択された有意水準αであることを確認するのはそれほど難しくありません。したがって、タイプIエラーを制御するために、αH1H0αα-「偽の証拠」を受け入れる意思を反映したレベル。
直感的には、これは、膨大な数のサンプルを描画し、各サンプルでテストを実行すると、これらのテストの割合が間違った結論につながることを意味します。「多くのサンプルを平均化する」ことに注意することが重要です。同じテスト、多くのサンプル。 α
同じサンプルを使用して多くの異なるテストを行うと、複数のテストエラーが発生します(ファミリ単位のエラー境界に関するanserを参照してください:独立した質問の異なる研究でデータセットを再利用すると、複数のテストの問題が発生しますか?)。その場合、例えば、ボンフェローニ補正など、家族ごとのエラー率(FWER)を制御する手法を使用して、インフレーションを制御できます。α
FWERとは異なるアプローチは、偽発見率(FDR)を制御することです。その場合、すべての発見(D)のうち偽発見(FD)の数を制御するため、F Dを制御します。、Dは拒否されたH0の数です。FDDH0
したがって、タイプIのエラー確率は、多くの異なるサンプルで同じテストを実行することに関係しています。膨大な数のサンプルの場合、タイプIのエラー確率は、誤った棄却につながるサンプル数に収束し、描画されたサンプルの総数で除算されます。
FDRは、同じサンプルに多くのテストを行うことやテストの膨大な数のために、それはなります持っているタイプIエラーが行われるテストの数に収束(すなわち偽発見の数)の拒否の総数で割っ(つまり、発見の総数)H0。
上記の2つの段落を比較することに注意してください。
- コンテキストは異なります。1つのテストと多くのサンプル対多くのテストと1つのサンプル。
- タイプIのエラー確率を計算するための分母は、FDRを計算するための分母とは明らかに異なります。分子はある意味で似ていますが、コンテキストが異なります。
FDRは、同じサンプルで多くのテストを実行し、1000の発見(つまり拒否)を発見した場合、0.38のFDRで0.38 × 1000の偽発見が発生することを示しています。H00.38×1000
The p – value represents the probability of making a type I error, or rejecting the null hypothesis when it is true
p –値は、タイプIエラーを犯す、つまり、帰無仮説が真であるという仮定の下で棄却するアプリオリ確率を表します。