帰無仮説が真である確率


14

したがって、これはよくある質問かもしれませんが、満足のいく答えを見つけたことがありません。

帰無仮説が真(または偽)である確率をどのように決定しますか?

学生にテストの2つの異なるバージョンを与え、それらのバージョンが同等かどうかを確認したいとします。t検定を実行すると、p値が.02になります。なんて素敵なp値でしょう!つまり、テストが同等である可能性は低いということです。いいえ。残念ながら、P(results | null)はP(null | results)を伝えないようです。通常行うべきことは、低いp値に遭遇したときに帰無仮説を棄却することですが、どのようにして、真である可能性が高い帰無仮説を棄却していないことを知ることができますか?馬鹿げた例を挙げると、偽陽性率が.02のエボラのテストを設計できます。50個のボールをバケツに入れて、1個の「エボラ」を書き込みます。私がこれを使って誰かをテストし、彼らが「エボラ」ボールを選んだ場合、p値(P(ボールを選ぶ|エボラがない))は0.02です。

私がこれまで考えてきたこと:

  1. P(null | results)〜= P(results | null)と仮定すると、いくつかの重要なアプリケーションでは明らかにfalseです。
  2. P(null | results)を知らずに仮説を受け入れるか拒否する–なぜそれらを受け入れるか拒否するのか?私たちが考えていることを偽りのように間違って拒否し、本当のことを本当に受け入れているという点ではありませんか?
  3. ベイズの定理を使用する-しかし、どのようにして事前分布を取得しますか?それらを実験的に決定しようとして同じ場所に戻ってしまいませんか?そして、それらをアプリオリに選ぶことは非常にarbitrary意的です。
  4. stats.stackexchange.com/questions/231580/という非常に似た質問を見つけました。ここでの1つの答えは、基本的に、ベイズの質問であるため、帰無仮説が真である確率について尋ねるのは意味がないと言っているようです。たぶん私はベイジアンですから、その質問をしないのは想像できません。実際、p値の最も一般的な誤解は、それらが真の帰無仮説の確率であるということです。この質問を頻繁に行う人として本当に質問できない場合、私の主な質問は#3です。ループに巻き込まれずに、どのようにして優先順位を取得しますか。

編集:思慮深い返信をありがとうございます。いくつかの一般的なテーマに対処したいと思います。

  1. 確率の定義:これに関する多くの文献があると確信していますが、私の素朴な概念は、「完全に合理的な存在が情報を与えたという信念」や「状況が利益を最大化する賭けのオッズ」のようなものです繰り返され、未知のものは変化することを許された」。
  2. P(H0 |結果)を知ることはできますか?確かに、これは難しい質問のようです。しかし、確率は常に与えられた情報を条件としているため、すべての確率は理論的には知っていると信じています。すべてのイベントは発生するか発生しないため、完全な情報では確率は存在しません。情報が不十分な場合にのみ存在するため、知っておく必要があります。たとえば、誰かがコインを持っていると言われ、ヘッドの確率を尋ねられたら、50%と言います。コインの頭に70%の重みが付けられている場合がありますが、その情報が与えられなかったので、私が持っていた情報の確率は50%でした。私がそれを学んだときに頭に。確率は常に(不十分な)データのセットを条件としているため、
    編集:「常に」は少し強すぎるかもしれません。確率を決定できない哲学的な質問があるかもしれません。それでも、実際の状況では、「ほぼ決して」絶対的な確実性を持つことはできませんが、「ほぼ常に」最良の推定値があるはずです。

1
あなたの「帰無仮説」がようなものである場合、つまり、ある差がゼロである場合、それを拒否することはH Aθ = 0であるという十分に強い証拠を見つけたことを意味します。あなたは可能性の代わりのような帰無仮説のためのH 0| θ | Δいくつかの差は、少なくとも同じ大き通りであること、である、ΔΔは、研究者は、彼らが気に最小の差があると考えるものです)、そしてあなたが見つかったことを意味拒否H AH0:θ=0HA:θ=0H0:|θ|ΔΔΔ(すなわち - ΔHA:|θ|<Δ)。同等性のテストを参照してください。stats.stackexchange.com/ tags / tost / infoΔ<θ<Δ
Alexis

実験(および実験の結果を分析する統計的検定)の力は、与えられたサイズ以上の効果があった場合、実験が与えられた有意性のしきい値でそれを検出する確率です。statisticsdonewrong.com/power.html
ベネットブラウン


あなたのコインの例は良い例です。結果知っているだけで、それ以上の仮定をしないと、P(H0 | results)を決して知ることができないことを示しています。あなたは、コインの特定の公平性を「仮定」する特定のスローでヘッドの確率を知っています?はい。(ただし、これは仮定を前提とする仮定であり、仮定が真であるかどうわかりません)過去の多くの結果を知りながら、与えられたスローでのヘッドの確率を知っています。番号!そして、あなたが知っている以前の結果の数がどれほど大きいかは関係ありません。次の投球の確率の頭を正確に知ることはできません。
セクストゥスエンピリカス

回答:


13

あなたは確かに重要な問題を特定しました、そして、ベイジアン主義はそれを解決する1つの試みです。必要に応じて、情報のない事前を選択できます。ベイズのアプローチについて、他の人にもっと詳しく説明させていただきます。

しかし、ほとんどの状況では、あなたは知っています母集団のヌルは偽であり、効果の大きさはわかりません。たとえば、完全にばかげた仮説を立てる場合、たとえば、人の体重がSSNが奇数か偶数かに関係しているなど、どうにかして母集団全体から正確な情報を取得する場合、2つの平均は正確に等しくなりません。それらは(おそらく)わずかな量だけ異なりますが、完全には一致しません。'このルートに進むと、p値と有意性テストの重要性が低くなり、効果の大きさとその精度の推定値を見るのに時間がかかります。そのため、サンプルが非常に大きい場合、SSNが奇数の人の体重はSSNが偶数の人の体重より0.001ポンド多く、この推定の標準誤差は0.000001ポンドであるため、p <0.05ですが、誰も気にしないでください。


1
私はあなたに反対しているわけではありませんが、彼がp(data | H0)またはp(H0 | data)を心配しているとき、彼は低研究について話していると思いませんか。あなたが与える例は、それぞれの弱点/主観性が豊富なデータの観点から重要ではないので、ベイジアンとフリークエンシーの両方のフレームワークで簡単です。この状況で引き続き発生する可能性のある唯一のエラーは、重要性とエフェクトサイズを混同することです。n
デビッドエルンスト

1
エフェクトサイズについての良い点。質問が本質的にブールである病気の検査のような状況に類似したものはありますか?
カレフマリク

1
FWIW、私は人の体重と彼らのSSNが奇数か偶数かには関係がないと完全に信じています。観察研究では、これらの変数は他のいくつかの変数などと相関関係にあり、最終的に非ゼロの限界関連があります。有効なポイントは、ほとんどの研究者が調査に時間を費やしているため、本当の非ゼロ効果があると疑う正当な理由があるということです。
GUNG -復活モニカ

1
@gungはあなたが望むものは何でも信じることができますが、体重とSSNの間には確実にゼロ以外の関係があります。私たちはその関係について、その存在以外にもっと何かを知っており、おそらく小さいことを知っています。
エモリー

1
重量は連続変数であることを知っています。キログラムの整数として記録するかもしれませんが。あなたのコメントは、観察研究(サンプルに基づいて母集団に関する推論を引き出す)に関するものでした。私の研究は架空の資金で賄われているため、無限精度スケールを使用した人口研究であり、統計的推論は不要です。
エモリー

3

この質問に答えるには、確率を定義する必要があります。これは、帰無仮説が真(点帰無仮説を検討する場合はほとんどないことを除く)または偽であるためです。1つの定義は、私の確率が、私のデータがその仮説から生じた可能性があるという個人的な信念を、私のデータが検討している他の仮説から生じた可能性と比較することであるということです。このフレームワークから開始する場合、事前情報は、すべての以前の情報に基づいた単なる信念であり、手元のデータは除外されます。


いい視点ね。確率に関する私の考えは、個人的なものではなく、「完全に合理的な信念」のようなものだと思います。あなたのポイントに対処するために質問を編集しました。
カレフマリク

2

重要な考え方は、大まかに言って、何かが間違っていることを経験的に示すことができるということです(反例を提供するだけです)が、何かが間違いなく正しいことを示すことはできません(反例がないことを示すには「すべて」をテストする必要があります)。

偽造可能性は科学的方法の基礎です:理論が正しいと仮定し、その予測を実際の世界で観察したものと比較します(たとえば、Netwonの重力理論は、それが判明するまで「真」であると信じられていました)極端な状況ではうまく機能しません)。

これは、仮説検定でも発生します。P(results | null)が低い場合、データは理論と矛盾している(または不運だった)ため、帰無仮説を棄却することは理にかなっています。実際、nullが真であり、P(null)= P(null | results)= 1であると仮定すると、P(results | null)が低い唯一の方法は、P(results)が低い(タフな運)ことです。

一方、P(results | null)が高い場合、誰が知っているか。nullがfalseである可能性がありますが、P(result)は高く、その場合、より良い実験を設計する以外に、実際には何もできません。

繰り返しますが、帰無仮説が(おそらく)偽であることを示すことができるだけです。だから私は答えがあなたの2番目のポイントの半分だと言うでしょう:あなたはPを拒否するためにP(results | null)が低いときにP(null | results)を知る必要はありませんが、nullがtrueであると言うことはできません(結果| null)が高い。

これはまた、再現性が非常に重要である理由でもあります。5回のうち5回は不運であることは疑わしいでしょう。


H0Halternatve

私はマーティンに同意します。帰無仮説が偽である確率を判断する方法を教えていただければ、私の質問に対する成功した答えだと思います。
カレフマリク

μ1000Pμ1000=3.50

2

-------------------------------------------------- ---------------------

(編集:この質問に対する私のコメントのバージョンをこの回答の一番上に置くと便利だと思います。

p(a | b)の非対称計算は、p(result | hypothesis)のように、因果関係として見られる場合に発生します。この計算は両方向では機能しません。仮説は考えられる結果の分布を引き起こしますが、結果は仮説の分布を引き起こしません。

P(result | hypothesis)は、因果関係仮説->結果に基づく理論値です。

p(a | b)が相関または観測された頻度(必ずしも因果関係ではない)を表す場合、対称になります。たとえば、スポーツチームが勝った/負けたゲームの数と、スポーツチームのスコアがコンティンジェンシーテーブルの2ゴール以下である場合に記録します。その場合、P(win | score> 2)およびP(score> 2 | win)は、同様の実験的/観測的(理論的ではない)オブジェクトです。

-------------------------------------------------- -------------------

非常に単純化

表現P(result | hypothesis)は非常に単純に見えるので、単純に用語を逆にできると考えるようになります。ただし、「結果」は確率分布(確率が与えられた場合)を持つ確率変数です。そして、「仮説」は(通常)確率変数ではありません。「仮説」を確率変数にすると、異なる結果の確率分布があるのと同じように、異なる可能性のある仮説の確率分布を意味します。(しかし、結果はこの仮説の確率分布を与えず、ベイズの定理により分布を単に変更します)


赤/青のビー玉を50/50の比率で入れた花瓶から10個のビー玉を描いたとします。そうすれば、P(結果|花瓶実験)のようなものを簡単に表現できますが、P(花瓶実験|結果)を表現することはほとんど意味がありません。結果は(それ自体で)異なる可能な花瓶実験の確率分布ではありません。

複数のタイプの花瓶実験がある場合、その場合、P(花瓶実験のタイプ)のような表現を使用し、ベイズ規則を使用してP(花瓶実験のタイプ|結果)を取得することができます。花瓶実験は確率変数です。(注:より正確にはP(花瓶実験のタイプ|結果&花瓶実験のタイプの分布))

それでも、このP(花瓶実験のタイプ)には、与えられた初期分布P(花瓶実験のタイプ)についての(メタ)仮説が必要です。


直感

以下の表現は、一方向を理解するのに役立つかもしれません

X)Xについての仮説が与えられると、Xの確率を表現できます。

かくして

1)結果に関する仮説が与えられれば、結果の確率を表現できます。

そして

2)これらの仮説について(メタ)仮説が与えられた場合、仮説の確率を表現できます。

(1)の逆を表現できるのはベイズ規則ですが、これには(2)が必要です。仮説は確率変数である必要があります。


解決策としての拒絶

そのため、結果が与えられた仮説の絶対確率を取得することはできません。それは人生の事実であり、この事実と戦おうとすることは、満足のいく答えを見つけられない原因のようです。満足のいく答えを見つけるための解決策は、仮説の(絶対)確率を取得できないことを受け入れることです。


常連客

仮説を受け入れられないのと同じように、P(result | hypothesis)がゼロに近い場合、(自動的に)仮説を拒否すべきではありません。それは私たちの信念の変化を支持する証拠があることを意味するだけであり、P(結果)とP(仮説)にも依存します。

頻度の高い人が何らかの拒否スキームを持っている場合、それは問題ありません。彼らが表現するのは、仮説が真であるか偽であるか、あるいはそのような場合の確率ではない。彼らはそれをすることができません(事前なしで)。その代わりに彼らが表現するのは、彼らの方法の失敗率(自信)についての何かです(特定の仮定が当てはまる場合)。


全知

このすべてを引き出す1つの方法は、確率の概念を排除することです。花瓶に100個のビー玉の全個体数を観察すると、仮説に関する特定のステートメントを表現できます。したがって、全知になり、確率の概念が無関係である場合、仮説が真であるかどうかを述べることができます(ただし、確率も方程式から外れています)


花瓶の例は理にかなっています。しかし、実際には、花瓶の中に各色のビー玉がいくつあるかはほとんどわかりません。私はいつも「青よりも赤の大理石が多い」という質問を抱いています。私のデータは、花瓶から4つの赤い大理石と1つの青い大理石を描いたことです。今、「おそらく100個ほどのビー玉があり、それぞれのビー玉は50%の確率で赤または青である」などの仮定を立てることができますが、実際には、非任意および非円形の取得方法に迷いがちですこれらの事前。
カレフマリク

それは確率に関する問題というより認識論的な問題です。P(result | hypothesis)のような式は、同様の方法で「偽」です。つまり、それは仮説的な式です。「現実」についての特定の仮説的な信念を前提として、結果の確率を表現できます。実験結果の確率が仮説であるのと同じように、何らかの理論の確率の表現(結果の観測の有無にかかわらず)は、「現実」についての特定の仮説的信念を必要とします。はい、事前確率はいくぶんarbitrary意的です。しかし、仮説もそうです。
セクストゥスエンピリカス

確率について話す。ベイズ規則は約2つの確率変数であることに注意してください:P(a | b)P(b)= P(b | a)P(a)。条件付き確率を関連付けることができます。これらのP(b | a)の1つが因果関係である場合(「理論は結果の分布につながる」など)、正確に計算できます。そのような場合は、(1方向の)因果関係のみです。この仮説により、必要なものすべて(仮説)、花瓶のビー玉を知ることができます。他の方法では、機能しません。実験結果4赤対青1 は、花瓶のビー玉の確率分布を引き起こしません。
セクストゥスエンピリカス
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.