したがって、これはよくある質問かもしれませんが、満足のいく答えを見つけたことがありません。
帰無仮説が真(または偽)である確率をどのように決定しますか?
学生にテストの2つの異なるバージョンを与え、それらのバージョンが同等かどうかを確認したいとします。t検定を実行すると、p値が.02になります。なんて素敵なp値でしょう!つまり、テストが同等である可能性は低いということです。いいえ。残念ながら、P(results | null)はP(null | results)を伝えないようです。通常行うべきことは、低いp値に遭遇したときに帰無仮説を棄却することですが、どのようにして、真である可能性が高い帰無仮説を棄却していないことを知ることができますか?馬鹿げた例を挙げると、偽陽性率が.02のエボラのテストを設計できます。50個のボールをバケツに入れて、1個の「エボラ」を書き込みます。私がこれを使って誰かをテストし、彼らが「エボラ」ボールを選んだ場合、p値(P(ボールを選ぶ|エボラがない))は0.02です。
私がこれまで考えてきたこと:
- P(null | results)〜= P(results | null)と仮定すると、いくつかの重要なアプリケーションでは明らかにfalseです。
- P(null | results)を知らずに仮説を受け入れるか拒否する–なぜそれらを受け入れるか拒否するのか?私たちが考えていることを偽りのように間違って拒否し、本当のことを本当に受け入れているという点ではありませんか?
- ベイズの定理を使用する-しかし、どのようにして事前分布を取得しますか?それらを実験的に決定しようとして同じ場所に戻ってしまいませんか?そして、それらをアプリオリに選ぶことは非常にarbitrary意的です。
- stats.stackexchange.com/questions/231580/という非常に似た質問を見つけました。ここでの1つの答えは、基本的に、ベイズの質問であるため、帰無仮説が真である確率について尋ねるのは意味がないと言っているようです。たぶん私はベイジアンですから、その質問をしないのは想像できません。実際、p値の最も一般的な誤解は、それらが真の帰無仮説の確率であるということです。この質問を頻繁に行う人として本当に質問できない場合、私の主な質問は#3です。ループに巻き込まれずに、どのようにして優先順位を取得しますか。
編集:思慮深い返信をありがとうございます。いくつかの一般的なテーマに対処したいと思います。
- 確率の定義:これに関する多くの文献があると確信していますが、私の素朴な概念は、「完全に合理的な存在が情報を与えたという信念」や「状況が利益を最大化する賭けのオッズ」のようなものです繰り返され、未知のものは変化することを許された」。
- P(H0 |結果)を知ることはできますか?確かに、これは難しい質問のようです。しかし、確率は常に与えられた情報を条件としているため、すべての確率は理論的には知っていると信じています。すべてのイベントは発生するか発生しないため、完全な情報では確率は存在しません。情報が不十分な場合にのみ存在するため、知っておく必要があります。たとえば、誰かがコインを持っていると言われ、ヘッドの確率を尋ねられたら、50%と言います。コインの頭に70%の重みが付けられている場合がありますが、その情報が与えられなかったので、私が持っていた情報の確率は50%でした。私がそれを学んだときに頭に。確率は常に(不十分な)データのセットを条件としているため、
編集:「常に」は少し強すぎるかもしれません。確率を決定できない哲学的な質問があるかもしれません。それでも、実際の状況では、「ほぼ決して」絶対的な確実性を持つことはできませんが、「ほぼ常に」最良の推定値があるはずです。