彼の議論に対する私の個人的な評価:
- ここで彼はをNullの証拠として使用することについて話していますが、彼の論文はpをNullに対する証拠として使用することはできないというものです。したがって、この議論はほとんど無関係だと思います。pp
- これは誤解だと思います。フィッシャーの検定は、ポッパーの批判的合理主義の考え方に強く従い、理論を支持することはできず、それを批判するだけであると述べています。したがって、その意味では、単一の仮説(Null)のみがあり、データがそれに従っているかどうかを単純にチェックします。p
- ここに同意しません。これは検定統計量に依存しますが、は通常、Nullに反するエフェクトサイズの変換です。したがって、効果が高いほど、p値は低くなります。他のすべての条件は同じです。もちろん、異なるデータセットまたは仮説では、これはもはや有効ではありません。 p
- 私はこの声明を完全に理解しているとは確信していませんが、私がこれを集めることができることから、人々が誤ってそれを使用するときの問題は少なくなります。pは長期的な周波数解釈を行うことを目的としており、それはバグではなく機能です。しかし、仮説の証拠として単一のp値をとる人々、またはp < .05のみを公開する人々をpのせいにすることはできません。 ppppp<.05
証拠の尺度として尤度比を使用するという彼の提案は、私の意見では良いものです(ただし、ここではベイズ因子の考え方がより一般的です)が、彼がそれをもたらす文脈では少し独特です:最初に彼は去ります尤度比を計算するための対立仮説がないフィッシャー試験の根拠。しかし、nullに対する証拠としてのは漁師です。したがって、彼はフィッシャーとネイマン・ピアソンを混乱させます。第二に、我々が使用するほとんどの検定統計量は(関数の)尤度比であり、その場合、pは尤度比の変換です。以下のようコスマ・シャリッチはそれを置きます:pp
与えられたサイズすべてのテストの中で、最小のミス確率または最高のパワーを持つテストは、「q (x )/ p (x )> t (s )であれば「信号」と言い
、そうでなければ「ノイズ」と言います。 、およびしきい値t
はsに反比例して変化します。量q (x )/ p (x )は尤度比です。Neyman-Pearsonの補題では、電力を最大化するために、ノイズよりも十分に可能性が高い場合は「信号」と言う必要があります。sq(x)/p(x)>t(s)tsq(x)/p(x)
ここで、は「信号」状態の密度、p (x )は「ノイズ」状態の密度です。「十分に可能性が高い」の尺度は、ここでP (q (X )/ p (x )> t o b s ∣ H 0)これはpです。正しいネイマン-ピアソンテスト中ことに留意されたいT O B S固定により置換されているT (S )ようにPq(x)p(x)P(q(X)/p(x)>tobs∣H0)ptobst(s)。 P(q(X)/p(x)>t(s)∣H0)=α