帰無仮説を棄却するには0.04993のp値で十分ですか?


20

Wilcoxonの符号付きランクの統計的有意性検定で、値を生成するデータに。しきい値が場合、この結果は帰無仮説を棄却するのに十分ですか?または、p値を小数点以下3桁に丸めるとになるため、テストが決定的ではなかったと言っても安全ですか?0.04993 p < 0.05 0.050p0.04993p<0.050.050


24
0.04993 <0.05ですので、それはちょうど低いです。P値を小数点以下数桁まで信頼できないという本能はありますが、プログラムが0.05未満と言った場合、人々は一般にそれを配信されたものと見なします。ここでの本当の問題は、固定レベルの有意性テストのフェチを作成することであり、0.05未満は「本当」、「公開可能」、「幸福の原因」を意味し、反対は「幻想」、「公開不可能」、「悲惨の原因」を意味します。統計に関する最も優れた入門書では、これについてある程度議論しています。良いものの1つは、フリードマン、ピサニ、パーベス、統計です。ニューヨーク:WW Norton、すべてのエディション。
ニックコックス

8
p値が0.051である場合、あなたの決定はどうなるか自問する必要がありますか?0.049の場合はどうなりますか?別の決断をしますか?どうして?
-AlefSin

2
コメントしてくださってありがとうございます。私たちの場合、データが公開可能かどうかなどについては考えていません。この結果の統計的有意性について、論文で声明を作成することを検討しているだけで、声明が不正確または不正確でないことを確認したいのです。 。
イスラムエルナバラウィ

3
P = 0.04993を報告することが思い浮かぶものです。レビューアまたは編集者のコメントを予測することは困難です。丸める場合、一貫した丸め規則を指定することは常に良い考えであり、広く受け入れられています。一部の人々は3 dpに丸め、またある種のスター付き規則を使用する場合があるため、0.050(3 dp)を報告し、<0.05としてスターを付けることは一貫しています。
ニックコックス

2
私は知らない...たぶん、ダブルブートストラップを実行し、値の信頼区間を計算する必要があります!正直に言って、「調査結果は重要で、でした。」その時点で、あなたは髪の毛を割っています、そして誰もが突然、科学を動かすための完全に任意の方法である誤検知の1/20オッズであることを覚えています。0.049 < p < 0.050p0.049<p<0.050
AdamO

回答:


21

ここには2つの問題があります。

1)正式な仮説検定を実行している場合(そして、私の本のp値を引用する場合は、すでに行っています)、正式な拒否ルールとは何ですか?

テスト統計をクリティカル値と比較する場合、クリティカル値は棄却域にあります。すべてが連続している場合、この形式は重要ではありませんが、検定統計量の分布が離散的である場合は重要です。

同様に、p値と有意水準を比較するときのルールは次のとおりです。

          場合拒否pα

p値を0.05に切り上げた場合でも、実際に値が正確に0.05であったとしても、正式には拒否する必要があることに注意してくださいp

2)「私たちのp値は私たちに何を伝えているのか」という点で、p値を「nullに対する証拠」として解釈することさえできると仮定すると(その意見はいくらか分かれているとしましょう)、0.0499と0.0501はそうではありません実際にデータについて異なることを言っています(効果のサイズはほとんど同じになる傾向があります)。

私の提案は、(1)nullを正式に拒否することであり、おそらく正確に0.05であっても拒否する必要があることを指摘するでしょう。(2)について特に特別なことはなく、その境界線に非常に近いことに注意してください-わずかに小さい有意しきい値でも拒否につながりません。α=0.05


2
ただし、非常によく似た引数を使用して、nullを拒否することはできません。0.05について特別なものはありません。0.06を制限として選択した場合、おそらく質問することはないでしょうが、状況はそれほど変わりません。この結果の人生の意味?」。例えば、これが生物学的実験である場合、特定の結果の生物学的意義を探し、p値をそのまま報告し、むしろ生物学についてコメントします。
ニコ

@nicoこれはすでに私のアイテムのポイントでした(2)。(1)
Glen_b -Reinstate Monica

グレンとニコ、ありがとう。データのこの部分は実験の副次的なものであったため、値をそのまま報告することになりました。いずれにしても、私はこれを受け入れられた答えとしてマークしています。回答またはコメントをいただいた参加者全員に感謝します。
イスラムエルナバラウィ

5

それは見る人の目にあります。

正式には、問題に対する厳格な決定ルールがある場合は、それに従ってください。これは、が指定されていることを意味します。ただし、これが当てはまる問題は認識していません(ただし、設定することは、Statistics101の後に多くの実践者が行うことです)。α = 0.05αα=0.05

ですから、AlefSinが以前にコメントしたものに本当に要約されます。質問に「正解」することはできません。あなたが得たものを、丸めるかどうかを報告します。

「重要性の意義」に関する膨大な文献があります。上の例のためにドイツの大手統計学者ウォルター・クレイマーの一つの最近の論文を参照してください「統計的有意性のカルト-経済学者は、そのデータの話にするためにやるべきではないはずです何を」、Schmollers Jahrbuch 131、455から468、2011。


-6

p=0.05

重要な問題は、「私たちいくつかのデータに出会いました ...」というフレーズです。

pp

この種の統計的不正行為には、データ drという名前があります。興味深い仮説として論文で報告することについて、私はあいまいです。それはあなたがそれが保持すると予想する何らかの物理的な理由を持っていますか?

ただし、解決方法は1つあります。おそらくこの1つのデータセットに対してこの1つのテストのみを実行することをアプリオリに決定したのでしょう。後でそれを証明できるように、ラボノートに誰かの前で書き留めました。その後、テストを行いました。

p=0.05


14
これは、特定のフレージングの選択に過度に依存している可能性があります。単純に不適切な単語の選択から多くを推測している-ここの全員が英語を第一言語として持っているわけではない。潜在的な問題として提起する価値は間違いありませんが、単純に物事を大胆に(「絶対にそうではない」)述べることは、ここにあるものから伝えることができる以上のことを知っていることを意味します。(さらに、「ラボノート」への言及は、OPがラボで作業を行っていることを意味します。これは事実ではありません。繰り返しますが、ここにある以上のことを知っています。)
Glen_b -Reinstate Monica

10
マイク・マッコイ、あなたの答えに感謝しますが、私はこの場合Glen_bが正しいのではないかと心配しています。私は英語を母国語とせず、自分のスキルが許す限り流writeに文章を書き、話そうと努めていますが、使用法と意味合いは私をいらいらさせ続けています。そのため、この特定のケースでは、重要なものが見つかるまで別のことを試みませんでした。実際に、私たちが証明しようとしていたことは、エラー値に統計的に有意な増加がなかったことであり、特定のケースではエラーが実際に減少したことがわかり、Wテストを実行すると0.0499が得られました。
イスラームエルナバラウィ

1
マイク、質問の言い回しにも問題は見られませんでした。そして、他の誰もデータのスヌーピング、マイニング、drなどの兆候をここで見たようには見えません...そして、それは間違いなく見る人の目にあります。数学的事実はありませんが、統計学者が選択した決定規則があります。AlefSin、Glenのポイント(2)と私が書いたものを読み直してください。
スカルダガリー

3
@ IslamEl-Nabarawy等価性/差異の欠如を確立したい場合、しきい値に近い値または潜在的なデータスヌーピングを解釈する方法以外にも多くの問題があります。.05(または選択したエラーレベル)をわずかに超えるp値を見つけるだけでは、間違いなく十分ではありません。ここと他の場所で「同等性のテスト」を調べるか、まったく別の問題なので、それについて具体的に質問してください。
ガラ

4
「しかし、1つの方法があります。たぶん、この1つのデータセットだけでこの1つのテストを実行することをアプリオリに決定したのでしょう。あなたのテストをしました。あなたはこれをしなかった場合は、あなたの結果は、p = 0.05レベルで有効であり、そしてあなたは私のような懐疑論者にそれをバックアップすることができます。それ以外の場合は、申し訳ありませんが、それは統計的に有意な結果」ではありませんが証明されるまで有罪についての話無実。したがって、学問的な不正直さを排除する法医学的証拠がない場合、分析は価値がありませんか?シーシュ。
GoF_Logistic
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.