コインは900回投げられ、表が490回現れました。結果は、コインが公平であるという仮説を裏付けていますか?
コインは900回投げられ、表が490回現れました。結果は、コインが公平であるという仮説を裏付けていますか?
回答:
ここで自然な帰無仮説 コインに偏りがない、つまり確率が 頭の等しい 。最も合理的な対立仮説 それは 、一方的な対立仮説を立てることはできますが 。
検定の有意水準を選択する必要があります。それはあなた次第です。2つの伝統的な数字は%および %。
帰無仮説が成立するとします。その場合、頭の数には*の二項分布があり、平均値は、および標準偏差 。
公正なコインを投げる際に表の数が異なる確率 沿って 以上(いずれかの方向)は、対称性により、
したがって、コインが公平だった場合、それとは異なる多数の表 沿って 以上はかなりありそうもないでしょう。それは確率を持っているでしょう以下より%。そうで有意水準%、帰無仮説を棄却します。
また、二項式の正規近似を使用して、頭の数が または 帰無仮説の下で 。私たちの通常の意味があります と分散 です 確率で、標準法線である確率 。通常のテーブルから、これは約です。左尾を考慮に入れるには、ダブル。私達は得る、Wolfram Alphaの値にかなり近く、 \%。だから私たちが使うなら\%を重要度のレベルとして、再び帰無仮説を棄却します 。
コメント: 。二項式の正規近似では、二項式が 正常である確率を計算することにより 。調べたい場合は、連続性補正です。連続性補正を伴う正規近似を使用すると、次の確率が得られます。 以上または 頭数が少ないほど 、Wolfram Alphaが提供する「正確な」回答に非常に近い。したがって、古き良き時代のように、標準法線のテーブルを使用して「手動」で計算することにより、非常に正確な見積もりを見つけることができます。
。やや自然性の低い対立仮説を使用するとします。。もし、の確率 以上 。したがって、再び有意水準%、帰無仮説を棄却、実際に有意水準を使用していたとしても棄却 。
公正な硬貨が言うことは可能であるので、有意水準を設定することは常に必要です 以上の頭 トス、とんでもないほどありえない。
40 or more
なく、40 or less
またはちょうど40
?
コインに偏りがない場合、「表」の確率は 。したがって、900回の試行で投げられたヘッドの数は、、 があります 公正なコインの帰無仮説の下での分布。だから、-value-コインが遠い場合、結果がこの極端またはより極端になる確率は、
両面を求めるなら -値、それは
それがなぜそうであるのかを説明するのはあなたにお任せします。
質量関数は 、
計算はあなたにお任せします あなたが求める価値
注:ここでのサンプルサイズは十分に大きいため、二項分布の正規近似を使用できます。上記で正確な計算方法を詳しく説明しました-値。
ベイズファクターのWikipediaページの例は、質問にかなり関連しているようです。コインが正確に不偏であるM1(q = 0.5)と頭の確率が不明であるM2の2つのモデルがある場合、1にフラットな事前分布を使用します。次に、ベイズ係数を計算します。
どこ
そして
ベイズ係数を与える 、通常の解釈のスケールによれば、「言及する価値はほとんどありません」。
ただし、(i)ベイズ因子には単純なモデルを優先する組み込みのoccamペナルティがあり、M2のように迷惑パラメータがないため、M1ははるかに単純です。(ii)事前にフラット物理的に妥当ではありません。実際には、コインが明らかに非対称でない限り、バイアスされたコインは公平に近くなります。(iii)長い一日であり、仮定から計算までの分析のどこかで間違いを犯した可能性があります。
コインが物理的なオブジェクトである場合、コインは偏っていることに注意してください。非対称性とは、尾のように頭から降りてくる可能性が低いためです。
あなたの質問はいくつかの異なる方法で対処できます。
従来の仮説検定は、可能性を除外するように設計されており、必ずしもそれらを証明するものではありません。この場合、使用できます帰無仮説として、データ(900ヘッドのうち490)を使用して、p値を計算することにより、この帰無仮説を棄却できるかどうかを確認します。p値が 次にnullを拒否しますが、p値 データがnullをサポートしていると言えるわけではありません。nullがtrueであるという仮定と一致しているだけですが、実際にはnullはfalseである可能性があり、trueは にとても近い 。
「同等」のアプローチは、公平ではなく むしろ、0.5前後の小さな領域を選択して、不偏と見なします 。次に、真の比率の信頼区間が完全に「不偏」の同値区間内にある場合、データは「不偏」の仮説をサポートします。
別のアプローチは、真の比率の事前分布から始めるベイジアンアプローチを使用することです。 0.5のポイントマスと残りの確率スプレッドを可能な値に渡って含みます。次に、それをデータと組み合わせて事後を取得します。の事後確率が それはそれが公平であるという主張を支持するのに十分高いです。
ベイジアンアプローチを明確にするために:
あなたP(Heads)
は何も知らないところから始め[0,1]
ます。したがって、最大エントロピーの前から開始してください-> uniform(0,1)
。これは、ベータ分布->として表すことができますbeta(1,1)
。
コインP(Heads)
をひっくり返すたびに、分布の各ポイントに尤度(x
ロールヘッドの(1-x)
場合は乗算、テールの場合は乗算)を掛けて、コインのベイジアン更新を行い、合計確率を1に再正規化します。 。これはベータ版のディストリビューションが行うことなので、最初のロールがヘッズであれば、あなたは持ってbeta(2,1)
いるでしょう。あなたの場合あなたは持っていbeta(490,510)
ます。
そこから95%の確率間隔を計算し、0.5がその間隔にない場合、疑わしくなります。
初めてこのエクササイズを行ったとき、収束にかかる時間に本当に驚いていました...誰かが「コインを100回P(Heads)
弾けば+/- 1%だとわかっている」と誰かが言ったので、これは完全に間違っています。100を超えるフリップが必要です。
帰無仮説、Ho:P = 0.5(P = Q = 0.5)
H1:P> 0.5
ここで、Pは頭の出現確率です。
z =(pP)/ sqrt(PQ / N)
ここで、p = 490/900 = 0.54
ここでz =(0.54-0.5)/ sqrt((0.5 * 0.5)/ 900)
z = 2
したがって、LOSが5%(つまり、1.64 <2)の場合、Hoは拒否されます
したがって、コインは偏っています。