いくつかの実用的な問題(たとえば、がarbitrary意的である程度など)を除いて、有意水準とp値の定義により、この質問に対する答えは明確になります。α
正式には、拒否ルールは、ときに拒否することですp = α。
離散的な場合にのみ問題になりますが、その状況で、ときに拒否しない場合p = α、タイプIエラー率は実際にはになりませんα!
(私に関する限り、「信頼できる」引用はありません。仮説検定へのネイマンピアソンとフィッシャーのアプローチの両方を理解する必要があり、それは時間の経過とともに発展したものです)
仮説検定を正しく説明する優れた統計テキストがいくつもあります。
p値の定義は、関連するWikipediaの記事の最初の文で正しく示されています *:
p値は、帰無仮説が真であると仮定して、少なくとも実際に観測されたものと同じくらい極端な検定統計量を取得する確率です。
*(いいえ、ウィキペディアは権威ではなく、定義が正しいと言っているだけです)
簡単にするために、ポイントヌルに固執しましょう。それは、追加の問題で水域を濁らせることなく、ポイントを獲得するのに役立ちます。
ここで、有意水準であるは、選択されたタイプIエラー率です。これは、真である場合に拒否される帰無仮説を選択する割合です。つまり、nullを拒否する必要がある時間の割合です。唯一の時間-今、離散分布と検定統計量を考慮したpの正確αが **実際に可能です。(通常、実際のアルファは、5%のように丸みのあるものとは異なる場合もあります。)αp α
**私は、議論を純粋に離散的または純粋に連続的な分散テスト統計のみに限定していると思います。混在するケースでは、個別の議論がどのように適用されるかを把握できます(適用される状況で)。
たとえば、両側符号検定を考えます。5%に最も近い達成可能な有意水準は4.904%です。それで、α = 4.904 %(より正確には、137500n = 17α = 4.904 %)。137500217
ときに真である私たちは時に拒否した場合、除去率は何のp = α?私達は達成できる。4.904%です- 選択したαです。H0p = αα
一方、が真の場合、p = αのときに棄却しない場合の棄却率はいくらですか?私達は達成できる。わずか1.27%です。それはαよりずっと小さいです。それは私たちがサインアップしたテストではありません!H0p = αα
つまり、が棄却領域内にある場合、テスト(明らかに!)に必要な特性があります。p = α
[今、あなたの状況を考えてみましょう。あなたのp値は実際に正確に5%ですか?いくつかの異なる理由で、正確にはそうではないに違いない。ただし、いずれにしても、は拒否であると正式に述べることができます。]p = α
前もって拒否ルールを説明し、(仮定が満たされていれば)望ましい有意水準があることを示す場合、おそらく参照の必要はありません。
拒否ルールは、テスト統計のどの値によってが拒否されるかについての単なるステートメントです。これは、拒絶領域を定義することと同等です(Casella and Berger、Statistical Inference、p346、用語拒絶領域を単純な用語で定義するを参照)。H0
同じ本は、ウィキペディアとは異なる用語でp値(p364)を定義しています(ただし、結果は同じです)。つまり、(所定のデータセットに対して)nullの拒否につながる最小のとして定義しています。α
(別のエディションを使用している場合、ページ番号は変更される可能性がありますが、インデックスが付いているため、用語を検索できます。注意してください、「仮説テスト」またはインデックス内の類似したものの下のリストを調べる必要がある場合があります「拒否地域」)
うーん、すぐに別の本を試してみましょう。ワッカー、Mendenhall&Scheaffer Mathematical Statistics with Applications、第5版では、p412に拒否領域を定義し、p431にp値(C&Bと同じdef)を定義しています。