フリップの数が増えるにつれて、テールと同じ数のヘッドをフリップする可能性が低くなる理由を説明する統計概念?


28

数冊の本を読んでコードを書くことで確率と統計の学習に取り組んでいます。コインフリップをシミュレートしているときに、私は自分の素朴な直感にわずかに反するものに気づきました。フェアコインを回裏返すと、が増加するにつれて、予想どおり、ヘッドとテールの比率が1に収束します。しかし、一方で、が増加すると、尾とまったく同じ数の頭をひっくり返す可能性が低くなり、それによって正確に 1の比率が得られるように見えます。nnn

例(私のプログラムからの出力)

For 100 flips, it took 27 experiments until we got an exact match (50 HEADS, 50 TAILS)
For 500 flips, it took 27 experiments until we got an exact match (250 HEADS, 250 TAILS)
For 1000 flips, it took 11 experiments until we got an exact match (500 HEADS, 500 TAILS)
For 5000 flips, it took 31 experiments until we got an exact match (2500 HEADS, 2500 TAILS)
For 10000 flips, it took 38 experiments until we got an exact match (5000 HEADS, 5000 TAILS)
For 20000 flips, it took 69 experiments until we got an exact match (10000 HEADS, 10000 TAILS)
For 80000 flips, it took 5 experiments until we got an exact match (40000 HEADS, 40000 TAILS)
For 100000 flips, it took 86 experiments until we got an exact match (50000 HEADS, 50000 TAILS)
For 200000 flips, it took 96 experiments until we got an exact match (100000 HEADS, 100000 TAILS)
For 500000 flips, it took 637 experiments until we got an exact match (250000 HEADS, 250000 TAILS)
For 1000000 flips, it took 3009 experiments until we got an exact match (500000 HEADS, 500000 TAILS)

私の質問はこれです:これを説明する概念/統計学/確率理論の原理はありますか?もしそうなら、それはどのような原理/概念ですか?

私がこれをどのように生成したかを見ることに興味がある人は、コードにリンクしてください。

-編集-

それが価値があることについては、ここで私が以前にこれを自分自身に説明していた方法があります。公正なコイン回、頭の数を数えると、基本的に乱数を生成しています。同様に、同じことをしてテールを数えると、乱数も生成されます。したがって、両方をカウントすると、実際には2つの乱数が生成され、が大きくなると、乱数は大きくなります。そして、生成する乱数が大きいほど、それらが互いに「ミス」する可能性が高くなります。これがおもしろいのは、2つの数値が実際にはある意味でリンクされており、それぞれの数値がランダムに分離されていても、大きくなるにつれて比率が1に収束することです。たぶんそれは私だけかもしれませんが、私はその種のきちんとしたものを見つけます。 nn


直感的または数学的な説明を求めていますか?
グレン_b-モニカの復活

1
両方、本当に。私は直感的な意味で理由理解していると思いますが、その背後にある正式な理由を理解したいと思います。
マインドクライム

1
二項確率を計算し、この状況に適用する方法を知っていますか?そうでない場合は、調べて計算を行います。
マークL.ストーン

うわー、この質問には複数の良い答えがあります。私は、一方を受け入れ、他方を受け入れないことについて親切に感じます。すべての回答と、これに関する洞察を共有するために時間を割いてくれたすべての人に感謝します。
マインドクライム

回答:


31

頭の数と尾の数が等しい場合は、「頭を得る時間のちょうど半分」と同じであることに注意してください。だから、頭の数を数えて、それが投げの半分の数であるかどうかを確認するか、頭の割合を0.5と同等に比較してみましょう。

ひっくり返すほど、可能な頭の数を増やすことができます-分布はより広がります(たとえば、95%の確率を含む頭の数の間隔は、トスの回数が増えるにつれて広くなります) 、したがって、ちょうど半分の頭の確率は、私たちがさらに投げるにつれて低下する傾向があります。

同様に、頭の割合はより多くの可能な値を取ります。100トスから200トスに移動するここを参照してください。

ここに画像の説明を入力してください

100回のトスでは、0.49ヘッドまたは0.50ヘッドまたは0.51ヘッドの割合を観察できます(ただし、これらの値の間に何もありません)が、200回のトスでは、0.49または0.495または0.50または0.505または0.510-確率は「カバー」する値が多いため、それぞれのシェアは小さくなる傾向があります。

あなたが持っているよりも考えてみましょういくつかの確率で投げ取得の(私たちはこれらの確率を知っているが、それはこの部分のために重要ではありません)の頭を、そしてあなたは、さらに2つの投げを追加します。で投げ、頭最も起こりそうな結果である(、それはそこからダウン)。p i i 2 n n p n > p n ± 12npii2nnpn>pn±1

トスで頭を持つ可能性は何ですか?2 n + 2n+12n+2

(これらの確率をラベル付けして、前の確率と混同しないようにします。また、P(HH)を次の2回のトスでの「Head、Head」の確率とします)q

qn+1=pn1P(HH)+pn(P(HT)+P(TH))+pn+1P(TT)

<pnP(HH)+pn(P(HT)+P(TH))+pnP(TT)=pn

つまり、コイントスをさらに2つ追加すると、最も可能性の高い(中間)値と両側の小さい値の平均を平均するため、中間値の確率は自然に低下します)

したがって、ピークが真ん中にあることが快適である限り()、が増加するにつれて正確に半分のヘッドの確率が減少する必要があります。n2n=2,4,6,...n


実際、が大きい、は比例して減少することを示すことができます(驚くことではありません。)。p n 1npnn1nn


要求に応じて、上記のプロットに近いものを生成するRコードを次に示します。

 x1 = 25:75
 x2 = 50:150
 plot(x1 / 100, dbinom(x1, 100, 0.5), type = "h",
       main = "Proportion of heads in 100 and 200 tosses",
       xlab = "Proportion of heads",
       ylab = "probability")
 points(x2 / 200, dbinom(x2, 200, 0.5), type = "h", col = 3)

1
あなたのグラフィックの1000語の長さに関して、上記の@RustyStatisticianに同意します。コードへのポインターの追加クレジット。
トムロッシュ

素晴らしい図と説明!

@Tomタイトルの「200」を緑にする以外のすべてを実行するコードを含めました。
Glen_b-モニカを

1
@Glen_bさらに素晴らしい投稿と、コード行を共有する寛大さをありがとう。美しいプロット!それを認めるのは難しいですが、私はあなたの投稿の概念の数学的表現、特に大文字の使用に問題があります。P
アントニ・パレラダ

1
@Antoniは、「追加の2回のトスで「Head、Head」を獲得する確率」を意味します。2n + 2回投げでn + 1頭を得るには、2n回投げて、n-1頭(そして2頭を投げた)またはn頭(そして1頭を投げた)またはn + 1頭(そして投げた)を持っている必要があります0頭)。P(HH)
Glen_b-モニカを

19

大数法則が実験の最初の結論を保証していることを知っています。つまり、公正なコインを回裏返すと、が増加するにつれて頭と尾の比率が1に収束します。 nnn

そこで問題はありません。しかし、このシナリオでは、すべての大数の法則に関することがわかります。

しかし、今、この問題についてもっと直感的に考えてください。ように、コインを数回反転させることを考えてください。n=2,4,8,10

コインを2回裏返す、つまり場合、2つの裏返しの可能なシナリオを考えてください。(ここでは頭を示し、は尾を示します)。最初のフリップではが得られ、2番目のフリップではが得られます。しかし、これは2つのフリップが発生する可能性がある1つの方法です。最初のフリップと2番目のフリップ、および他のすべての可能な組み合わせを取得することもできます。したがって、1日の終わりに2枚のコインをフリップすると、2つのフリップで見られる可能性のある組み合わせは であるため、をフリップするための4つの可能なシナリオがありますコイン。H T H T T H S = { H H H T T H T T } n = 2n=2HTHTTH

S={HH,HT,TH,TT}
n=2

S={HHHH,HHHT,HHTH,HTHH,THHH,HHTT,HTTH,TTHH,THHT,THTH,HTHT,HTTT,THTT,TTHT,TTTH,TTTT}
n=4

n=8

n=10

n2n

n=2

Pr(Ratio of exactly 1)=24=0.5
n=4
Pr(Ratio of exactly 1)=616=0.375

n

n

Pr(Ratio of exactly 1)0

そして、あなたの質問に答えるために。実際にあなたが観察しているのは、頭と尾の数が等しいコインフリップの組み合わせが、それらが等しい組み合わせの数と比較してはるかに多いという事実の結果です。



@Mark L. Stoneが示唆しているように、二項式と二項確率変数に慣れている場合は、それを使用して同じ引数を表示できます。

XnXXBin(n,p=0.5)p=0.5

Pr(Ratio of exactly 1)=Pr(X=n2)=(nn/2)0.5n/2(0.5)nn/2=(nn/2)0.5n

ここでも、が大きくなる傾向があるため、がため、上記の式は0に向かってい。n(nn/2)0.5n0n


2
をとしてもう少し言う必要があります...についても何か言う必要があります。(比較のため:であるいって、意味しない)。0.5n0n(nn/2)0.5n0n!0.5n0
シルバーフィッシュ

@Glen_bあなたの投稿にコメントするのに十分なポイントはありませんが、素晴らしいグラフィックです!

@RustyStatisticianに感謝します。あなたの説明の最初の部分は、私が考えていた方法とほとんど一致していますが、統計と並んでまだ十分ではなく、二項分布を使用してそれを解決する方法を知りません。私は基本的に問題や何かを解決することなく本を一読し、今は最初から戻って、素材のさまざまな側面を調べるためのコードを書いています。
マインドクライム

@mindcrimeは素晴らしいですね!お役に立てて嬉しいです。

5

パスカルの三角形を参照してください。

コインフリップの結果の可能性は、一番下の行に沿った数字で表されます。頭と尾が等しい場合の結果は中央の数字です。ツリーが大きくなる(つまり、フリップが増える)と、中央の数字は、下の行の合計の割合が小さくなります。


1

たぶん、これは逆正弦法に関連していると概説するのに役立つでしょう。それは言うことのための1つの結果のパス正または負の領域の中で最も時間のパス滞在がはるかに高いことが上がっていることをよりダウンよりも、ある確率あなたは直感に期待します。ここにいくつかのリンク:

http://www.math.unl.edu/~sdunbar1/ProbabilityTheory/Lessons/BernoulliTrials/ExcessHeads/excessheads.shtml

https://en.wikipedia.org/wiki/Arcsine_law


1

頭と尾の比率は1に収束しますが、可能な数の範囲は広くなります。(数字を作成しています)。100回のスローの場合、90%の確率で45%から55%の頭があります。それはあなたが45から55頭を得る90%です。ヘッド数の11の可能性。およそ9%の頭と尾が同数になります。

10,000回のスローの場合、95%の確率で49%から51%のヘッドが得られます。そのため、比率は1に非常に近くなりました。しかし、今では4,900〜5,100のヘッドがあります。201の可能性。等しい数のチャンスは約0.5%だけです。

そして、100万回のスローでは、49.9%から50.1%のヘッドを確実に持っています。これは、499,000〜501,000ヘッドの範囲です。2,001の可能性。可能性は0.05%になりました。

わかりました、数学は構成されました。しかし、これは「なぜ」についてのアイデアを提供する必要があります。比率が1に近づいたとしても、可能性の数は多くなるため、正確に半分の頭、半分の尾を打つことはますます少なくなります。

別の実際的な効果:実際には、頭を投げる確率がちょうど 50%であるコインを持っている可能性は低いです。本当に良いコインを持っている場合、49.99371%になる可能性があります。スローの数が少ない場合、これは違いをもたらしません。大きな数の場合、頭部の割合は50%ではなく49.99371%に収束します。スローの数が十分に大きい場合、50%以上のヘッドをスローすることは非常にまれになります。


0

さて、注意すべきことの1つは、偶数回のフリップ(それ以外の場合、頭と尻のフリップが等しい確率はもちろん正確にゼロです)で、最も可能性の高い結果は常に、尻のフリップと同じ数の頭のフリップを持つ結果になることです。

フリップの分布は、多項式の係数によって与えられ したがって、偶数場合、確率は n

(1+x2)n.
n
pn=2n(nn/2).

スターリング近似を使用する、全体的なフリップに対して 正確にヘッド(および対応するテール)フリップの確率について、ようなものに到達します 。そのため、この結果の絶対確率は0に収束しますが、他のほとんどの結果よりもはるかに遅く、頭が0(または尾が0)の極端な場合はます。n!

p1πn/2
n/2n2n

2
式で数量を慎重に定義することで、答えを改善できます。何である?とは何ですか?np
Sycoraxが復活モニカ言う

0

コインを2回裏返したとします。4つの可能な結果があります:HH、HT、TH、およびTT。これらの2つでは、頭と尾の数が等しいため、頭と尾の数が同じになる確率は50%です。

今、コインを4,306,492,102回裏返したとします。正確に 2,153,246,051個のヘッドと2,153,246,051個のテールで終わる50%のチャンスを期待しますか?


いいえ、私の直感では、数字が大きくなったからといって、正確に一致する可能性は低いと言っていました。しかし、自分の考えを確認するためだけにシミュレートしたかったのです。そのようになったのを見たとき、なぜそうなったのかという背後にある正式な理由について興味をそそられました。結果として得られる比率が1に向かって収束すると同時に、正確に1になる可能性が低くなるのは興味深いことです。
mindcrime15年

3
それについて考える一つの方法は、が大きいが小さいよりも50-50に近い方法がはるかに多いということです。nn
ダニエルマクラウリー
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.