コインが900回投げられて490回表が出たかどうかを評価する方法は?


9

コインは900回投げられ、表が490回現れました。結果は、コインが公平であるという仮説を裏付けていますか?


3
帰無仮説:コインは公平である。代替の、わかりにくい、おそらく頭の対称的な確率は1/2。重要度のレベル:あなたが決める。帰無仮説が成り立つ場合、頭部の数はほぼ正規分布、標準偏差になります。(900)(1/2)(1/2)=15。さて490 についてです 2.66 平均からの標準偏差の単位(450)帰無仮説が成立する場合 標準的な通常の表またはそれ以外の表から、これには約確率があります0.0078。で1有意水準%、帰無仮説を棄却します。

1
あなたは見ていたいかもしれませんHypotheseテスト

7
今後の参考のために:質問の逐語的コピーを複数のSEサイトにクロスポストすることは、お勧めしません。これは、このポリシーに精通していない新規ユーザーで一般的に発生するため、気分を害しないでください。ただ、覚えておいてください。サイトへようこそ。
枢機卿

この質問は、OPサヌの宿題の問題とまったく同じであるか、サヌが実際に尋ねた質問の言い換えである可能性があります。「結果は、コインが公平であるという仮説を裏付けていますか?」 すべての答えは、帰無仮説をP(Heads)=0.5。私の質問は、観測は帰無仮説をサポートすることですか?コインが表に降りてきたとしても450 時間切れ 900、つまりません帰無仮説をサポートして。ヌルの拒否をサポートする非常に弱い証拠のみ。証拠は常にnullの拒否を支持しており、nullを支持するものではありません。
Dilip Sarwate、2012年

@Dilip:グレッグの答えをもう一度読むと、上のコメントは正しくないことがわかります。同等性(または、多くの場合、生物学的同等性)テストには、証拠が必要な目的の仮説のわずかに「ファジー」バージョンである代替案があります。私たちが本当に望んでいるよりも少し余分な小部屋を用意する必要がある理由がすぐにわかると思います。
枢機卿

回答:


16

ここで自然な帰無仮説 H0 コインに偏りがない、つまり確率が p 頭の等しい 1/2。最も合理的な対立仮説H1 それは p1/2、一方的な対立仮説を立てることはできますが p>1/2

検定の有意水準を選択する必要があります。それはあなた次第です。2つの伝統的な数字は5%および 1%。

帰無仮説が成立するとします。その場合、頭の数には*の二項分布があり、平均値は(900)(1/2)=450、および標準偏差 (900)(1/2)(1/2)=15

公正なコインを投げる際に表の数が異なる確率 450 沿って 40 以上(いずれかの方向)は、対称性により、

2k=490900(900k)(12)900.
これは手動で計算するのは現実的ではありませんが、Wolfram Alphaはおおよその答えを出します 0.008419

したがって、コインが公平だった場合、それとは異なる多数の表450 沿って 40以上はかなりありそうもないでしょう。それは確率を持っているでしょう以下より1%。そうで1有意水準%、帰無仮説を棄却します。

また、二項式の正規近似を使用して、頭の数が490 または 410 帰無仮説の下で p=1/2。私たちの通常の意味があります450 と分散 15 です 490 確率で、標準法線である確率 40/15。通常のテーブルから、これは約です0.0039。左尾を考慮に入れるには、ダブル。私達は得る0.0078、Wolfram Alphaの値にかなり近く、 1\%。だから私たちが使うなら1\%を重要度のレベルとして、再び帰無仮説を棄却します H0

コメント: 1。二項式の正規近似では、二項式が490 正常である確率を計算することにより 489.5。調べたい場合は、連続性補正です。連続性補正を伴う正規近似を使用すると、次の確率が得られます。490 以上または 410 頭数が少ないほど 0.008468、Wolfram Alphaが提供する「正確な」回答に非常に近い。したがって、古き良き時代のように、標準法線のテーブルを使用して「手動」で計算することにより、非常に正確な見積もりを見つけることができます。

2。やや自然性の低い対立仮説を使用するとします。p>1/2。もしp=1/2、の確率 490 以上 0.00421。したがって、再び1有意水準%、帰無仮説を棄却、実際に有意水準を使用していたとしても棄却 0.005

公正な硬貨が言うことは可能であるので、有意水準を設定することは常に必要です550 以上の頭 900 トス、とんでもないほどありえない。


2
この質問は宿題としてマークされました。そのような場合、質問する人に仕事を残さない完全な自己完結型の回答を提供することは推奨されません。
マクロ

1
これはmath.SEからの回答で、質問とマージされ、math.SEの非常に高い担当者によって作成されました。質問は当時、あそこの宿題としてタグ付けされていませんでした。
枢機卿

「したがって、コインが公平でなかった場合、450から40以上異なるヘッドの数はかなりありそうもありません。」の論理はよくわかりません。なぜ私たちはの確率を計算する必要が40 or moreなく、40 or lessまたはちょうど40
オファーは

したがって、@ Marcoの回答には、混乱から生じたいいねが少なく、コメントがはるかに多い:p
Evan Pu

8

コインに偏りがない場合、「表」の確率は 12。したがって、900回の試行で投げられたヘッドの数は、X、 があります Binomial(900,12)公正なコインの帰無仮説の下での分布。だから、p-value-コインが遠い場合、結果がこの極端またはより極端になる確率は、

P(X490)

両面を求めるなら p-値、それは

1P(410<X<490)

それがなぜそうであるのかを説明するのはあなたにお任せします。

質量関数は YBinomial(n,p)

P(Y=y)=(ny)py(1p)ny

計算はあなたにお任せします pあなたが求める価値

注:ここでのサンプルサイズは十分に大きいため、二項分布の正規近似を使用できます。上記で正確な計算方法を詳しく説明しましたp-値。


必要があります p値は、両側検定または片側検定で計算されますか?
Dilip Sarwate、2012年

1
質問は、コインが公平であるかどうかを判断することだけを目的としていたので、両面を想像します。つまり、Ha:p1/2。しかし、上記の記述が逐語的な質問なのか、言い換えなのかは不明です。
マクロ

1
したがって、この場合、そしておそらく他の多くの場合、対称性は、両面 p-valueは片側のちょうど2倍です p-値。片面p-値が 0.005 両面 p-valueが大きくなります。したがって、ヌルは0.5% レベル(私が知っている、より一般的に使用されるのではない 5% そして 1%レベル)片側テストを使用している場合、両側テストを使用している場合は拒否されません。これは正しいです?
Dilip Sarwate、2012年

1
はい、レベルでテストを行っていた場合 α=.005の場合、両側検定ではなく片側検定を拒否します。ただし、片側または両側のテストを行うかどうかは、研究の質問に基づいてアプリオリに選択する必要があるため、この問題は実際には発生しません。
マクロ

「片側または両側のテストを事前に選択する必要があるかどうか」は有効ですが、選択が行われていない場合はどうなりますか?OP Sanuに、実験データがコインが不偏であるという仮説をサポートしていると伝えられるべきか0.5% レベル(ヌルは両側検定で拒否されません)だけでなく、次の仮説もサポートします P(Heads)>120.5%レベル(nullは片側テストで拒否されます)?
Dilip Sarwate、2012年

4

ベイズファクターのWikipediaページのは、質問にかなり関連しているようです。コインが正確に不偏であるM1(q = 0.5)と頭の確率が不明であるM2の2つのモデルがある場合、1にフラットな事前分布を使用します。次に、ベイズ係数を計算します。

K=p(x=490|M0)p(x=490|M1)

どこ

p(x=490|M1)=nchoosek(900,490)12900=7.5896×104

そして

p(x=490|M2)=01nchoosek(900,490)q490(1q)410dq=1901

ベイズ係数を与える K1.4624、通常の解釈のスケールによれば、「言及する価値はほとんどありません」。

ただし、(i)ベイズ因子には単純なモデルを優先する組み込みのoccamペナルティがあり、M2のように迷惑パラメータがないため、M1ははるかに単純です。(ii)事前にフラットq物理的に妥当ではありません。実際には、コインが明らかに非対称でない限り、バイアスされたコインは公平に近くなります。(iii)長い一日であり、仮定から計算までの分析のどこかで間違いを犯した可能性があります。

コインが物理的なオブジェクトである場合、コインは偏っていることに注意してください。非対称性とは、尾のように頭から降りてくる可能性が低いためです。


3

あなたの質問はいくつかの異なる方法で対処できます。

従来の仮説検定は、可能性を除外するように設計されており、必ずしもそれらを証明するものではありません。この場合、使用できますH0:p=0.5帰無仮説として、データ(900ヘッドのうち490)を使用して、p値を計算することにより、この帰無仮説を棄却できるかどうかを確認します。p値がα 次にnullを拒否しますが、p値 >α データがnullをサポートしていると言えるわけではありません。nullがtrueであるという仮定と一致しているだけですが、実際にはnullはfalseである可能性があり、trueは p にとても近い 0.5

「同等」のアプローチは、公平ではなく p=0.5 むしろ、0.5前後の小さな領域を選択して、不偏と見なします 0.5ϵ<p<0.5+ϵ。次に、真の比率の信頼区間が完全に「不偏」の同値区間内にある場合、データは「不偏」の仮説をサポートします。

別のアプローチは、真の比率の事前分布から始めるベイジアンアプローチを使用することです。 p0.5のポイントマスと残りの確率スプレッドを可能な値に渡って含みます。次に、それをデータと組み合わせて事後を取得します。の事後確率がp=0.5 それはそれが公平であるという主張を支持するのに十分高いです。


多くの場合、ベイジアンアプローチは連続的な事後をもたらすことに注意してください。したがって、 p=0.5 正確に 0になることがよくあります。より興味深い問題は、事後推定値が.5とどの程度異なるかということです。
Michael McGowan、2012年

2
@MichaelMcGowan:以前の点の質量で始まる場合 p=0.5後点の質量も存在します。この事前知識が理にかなっているかどうかは、問題によって異なります...
西安

2

そしてRイラスト:

法線で近似することを気にせず、帰無仮説の下でn = 900およびp = 0.5の確率変数分布二項式を見ることができます(つまり、コインが不偏である場合、p =表(または裏)の確率= 0.5)。

Ha:p <> 0.5というアルファ0.05の代替案をテストする場合は、次のようにnullの下で分布の裾を調べ、490が区間{421、479}の外にあることを確認して、Hoを拒否することができます。 。

n<-900
p<-0.5
qbinom(c(0.025,0.975),size=n,prob=p)
# 421 479

1

ベイジアンアプローチを明確にするために:

あなたP(Heads)は何も知らないところから始め[0,1]ます。したがって、最大エントロピーの前から開始してください-> uniform(0,1)。これは、ベータ分布->として表すことができますbeta(1,1)

コインP(Heads)をひっくり返すたびに、分布の各ポイントに尤度(xロールヘッドの(1-x)場合は乗算、テールの場合は乗算)を掛けて、コインのベイジアン更新を行い、合計確率を1に再正規化します。 。これはベータ版のディストリビューションが行うことなので、最初のロールがヘッズであれば、あなたは持ってbeta(2,1)いるでしょう。あなたの場合あなたは持っていbeta(490,510)ます。

そこから95%の確率間隔を計算し、0.5がその間隔にない場合、疑わしくなります。

初めてこのエクササイズを行ったとき、収束にかかる時間に本当に驚いていました...誰かが「コインを100回P(Heads)弾けば+/- 1%だとわかっている」と誰かが言ったので、これは完全に間違っています。100を超えるフリップが必要です。


0

帰無仮説、Ho:P = 0.5(P = Q = 0.5)

H1:P> 0.5

ここで、Pは頭の出現確率です。

z =(pP)/ sqrt(PQ / N)

ここで、p = 490/900 = 0.54

ここでz =(0.54-0.5)/ sqrt((0.5 * 0.5)/ 900)

z = 2

したがって、LOSが5%(つまり、1.64 <2)の場合、Hoは拒否されます

したがって、コインは偏っています。


1
当サイトへようこそ!返信する前に他の回答を読みましたか?あなたはそれらのいくつかに含まれている思慮深い分析を楽しむかもしれません。それらは同じ計算を含んでいるので、あなたの回答のどの部分またはそのプレゼンテーションの形式が、すでに投稿されているものよりも新しいまたはより良いものを表しているのかと思います。
whuber
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.