回答:
私の意見は、それは研究分野に依存しない(そしてすべきでない)ということです。たとえば、歴史的または確立された結果で研究を再現しようとしている場合、より低い有意水準で作業することができます(私が導いたストループ効果に関するいくつかの研究を考えることができます)過去数年間でいくつかの論争に)。これは、仮説を検証するための古典的なネイマン・ピアソンフレームワーク内のより低い「しきい値」を考慮することになります。ただし、統計的および実用的な(または実質的な)重要性は別の問題です。
サイドノート。「星系」は70年代には科学的調査を支配していたようですが、J。コーエンによるThe Earth Is Round(p <.05)を参照してください(American Psychologist、1994、49(12)、997-1003)、私がよく知りたいことが私が観察したデータが与えられているという事実にもかかわらず、が真である確率はですか?とにかく、Jerry Dallalによる" Why P = 0.05? " についての素晴らしい議論もあります。
たとえば、0.01未満の事前に指定されたアルファレベルを使用することは誰にとっても珍しいかもしれませんが、観測されたP値が0.01は、0.01未満のNeyman-Pearsonアルファと同じです。
フィッシャーのP値は、Neyman-Pearsonのエラー率と同じではありません。は、実験が設計されたときに有意性の臨界レベルとしてを使用することを決定していない限り、意味しません。あなたがかかったでしょう場合は大幅に続いて手段があること偽陽性請求の確率。α = 0.0023 0.0023 、P = 0.05 、P = 0.0023 0.05
ハバードらを見てください。古典的統計検定における証拠(p)とエラー(α)の測定値の混乱。アメリカ統計学者(2003)vol。57(3)
私はこの文献にはあまり詳しくありませんが、一部の物理学者は統計的検定ではるかに低いしきい値を使用していると思いますが、彼らはそれについて少し異なって話します。たとえば、メジャーが理論的予測からの3つの標準偏差である場合、それは「3シグマ」偏差として記述されます。基本的に、これは、対象のパラメーターがα= .01のz検定の予測値と統計的に異なることを意味します。2つのシグマは、α= .05とほぼ同等です(実際には1.96σになります)。私が間違っていない場合、物理学の標準エラーレベルは5シグマで、α= 5 * 10 ^ -7になります。
また、神経科学または疫学では、複数の比較のためにいくつかの修正を定期的に実行することがますます一般的になっているようです。したがって、個々のテストのエラーレベルは、p <.01より低くなる可能性があります。