Wilcoxonの符号付きランクの統計的有意性検定で、値を生成するデータに。しきい値が場合、この結果は帰無仮説を棄却するのに十分ですか?または、p値を小数点以下3桁に丸めるとになるため、テストが決定的ではなかったと言っても安全ですか?0.04993 p < 0.05 0.050
Wilcoxonの符号付きランクの統計的有意性検定で、値を生成するデータに。しきい値が場合、この結果は帰無仮説を棄却するのに十分ですか?または、p値を小数点以下3桁に丸めるとになるため、テストが決定的ではなかったと言っても安全ですか?0.04993 p < 0.05 0.050
回答:
ここには2つの問題があります。
1)正式な仮説検定を実行している場合(そして、私の本のp値を引用する場合は、すでに行っています)、正式な拒否ルールとは何ですか?
テスト統計をクリティカル値と比較する場合、クリティカル値は棄却域にあります。すべてが連続している場合、この形式は重要ではありませんが、検定統計量の分布が離散的である場合は重要です。
同様に、p値と有意水準を比較するときのルールは次のとおりです。
場合拒否
p値を0.05に切り上げた場合でも、実際に値が正確に0.05であったとしても、正式には拒否する必要があることに注意してください。
2)「私たちのp値は私たちに何を伝えているのか」という点で、p値を「nullに対する証拠」として解釈することさえできると仮定すると(その意見はいくらか分かれているとしましょう)、0.0499と0.0501はそうではありません実際にデータについて異なることを言っています(効果のサイズはほとんど同じになる傾向があります)。
私の提案は、(1)nullを正式に拒否することであり、おそらく正確に0.05であっても拒否する必要があることを指摘するでしょう。(2)について特に特別なことはなく、その境界線に非常に近いことに注意してください-わずかに小さい有意しきい値でも拒否につながりません。
それは見る人の目にあります。
正式には、問題に対する厳格な決定ルールがある場合は、それに従ってください。これは、が指定されていることを意味します。ただし、これが当てはまる問題は認識していません(ただし、設定することは、Statistics101の後に多くの実践者が行うことです)。α = 0.05
ですから、AlefSinが以前にコメントしたものに本当に要約されます。質問に「正解」することはできません。あなたが得たものを、丸めるかどうかを報告します。
「重要性の意義」に関する膨大な文献があります。上の例のためにドイツの大手統計学者ウォルター・クレイマーの一つの最近の論文を参照してください「統計的有意性のカルト-経済学者は、そのデータの話にするためにやるべきではないはずです何を」、Schmollers Jahrbuch 131、455から468、2011。
重要な問題は、「私たちはいくつかのデータに出会いました ...」というフレーズです。
この種の統計的不正行為には、データ drという名前があります。興味深い仮説として論文で報告することについて、私はあいまいです。それはあなたがそれが保持すると予想する何らかの物理的な理由を持っていますか?
ただし、解決方法は1つあります。おそらく、この1つのデータセットに対してこの1つのテストのみを実行することをアプリオリに決定したのでしょう。後でそれを証明できるように、ラボノートに誰かの前で書き留めました。その後、テストを行いました。