一連のコイン投げで頭と尾のパターンを打つのにかかった時間


26

TEDでのPeter Donnellyの講演に触発され、特定のパターンが一連のコイントスに現れるまでにかかる時間について議論し、Rで次のスクリプトを作成しました。これらのパターンのいずれかにヒットするまでに平均で要する時間(つまり、コインを投げる回数)を計算します。

coin <- c('h','t')

hit <- function(seq) {
    miss <- TRUE
    fail <- 3
    trp  <- sample(coin,3,replace=T)
    while (miss) {
        if (all(seq == trp)) {
            miss <- FALSE
        }
        else {
            trp <- c(trp[2],trp[3],sample(coin,1,T))
            fail <- fail + 1
        }
    }
    return(fail)
}

n <- 5000
trials <- data.frame("hth"=rep(NA,n),"htt"=rep(NA,n))

hth <- c('h','t','h')
htt <- c('h','t','t')

set.seed(4321)
for (i in 1:n) {
    trials[i,] <- c(hit(hth),hit(htt))    
}
summary(trials)

要約統計は次のとおりです。

      hth             htt        
 Min.   : 3.00   Min.   : 3.000  
 1st Qu.: 4.00   1st Qu.: 5.000  
 Median : 8.00   Median : 7.000  
 Mean   :10.08   Mean   : 8.014  
 3rd Qu.:13.00   3rd Qu.:10.000  
 Max.   :70.00   Max.   :42.000 

トークでは、コイン投げの平均回数は2つのパターンで異なると説明されています。私のシミュレーションからわかるように。何回かこの講演を見ていたのに、なぜそうなのか、まだよくわかりません。「hth」はそれ自体と重なり、直感的には「hth」よりも早く「hth」を打つと思いますが、そうではありません。誰かが私にこれを説明できれば本当に感謝しています。

回答:


32

最初にHを取得し、次にTを取得したときに何が起こるかを考えてください。

ケース1:HTHを探していて、HTを初めて見ました。次のトスがHであれば、完了です。Tの場合、スクエア1に戻ります。最後の2回のトスはTTだったので、完全なHTHが必要になりました。

ケース2:HTTを探していて、初めてHTを見たことがあります。次のトスがTであれば、完了です。Hの場合、これは明らかに後退です。ただし、Hがあり、-TTのみが必要なため、これはマイナーです。次のトスがHである場合、これにより状況が悪化することはありませんが、Tでは改善されます。

別の言い方をすれば、ケース2では、最初に表示されるHが3分の1になり、その時点からゼロから始める必要はありません。これは、TTが行ったすべての進捗を消去するケース1には当てはまりません。


ああ、このシナリオでは、1つのパターンが勝ったときにコインの反転が停止しません!それは理にかなっている。これはしばらく私を混乱させたので(TEDの話を見ていませんでした)、私は同じことを考えているかもしれない他の人を助けるためにコメントしたいと思いました。

15

8n+2nnHTHHTH

別の見方をすると、「HT」に達した後、「T」は「HTH」を最初に戻し、「H」は可能な「HTT」までの進行を開始します。

kk2k2+0+8=100+0+8=8

5

さらに悪化します。Penneyのゲームでは、レースするパターンを選択してから、別のパターンを選択します。「HTH」を選択した場合、「HHT」を選択し、2:1のオッズを獲得します。「HTT」を選択した場合、「HHT」を再度選択しますが、2:1のオッズが得られます。しかし、「HHT」を選択すると、「THH」が選択され、3:1のオッズが得られます。2番目のプレーヤーは常にオッズにバイアスをかけることができ、最良の選択肢は推移的ではありません。


+1ペニーのゲームへのリンクをありがとう。もっと眠れぬ夜:)
lafrasu

親愛なるヘンリー、私はこのサイトで同様の質問をし、ここで答えを探すように言われました。ペニーのゲームを見ましたが、それでも問題を解決できません。任意の助けをいただければ幸いです。
superAnnoyingUser

14

私は絵を描くのが好きです。

ここに画像の説明を入力してください

これらの図は、有限状態オートマトン(FSA)です。それらは、コインの反転に応じてトークンをあるノードから別のノードに移動することにより、それぞれHTTおよびHTHシーケンスを「認識」または「受け入れる」小さな子供向けのゲーム(シュートやラダーなど)です。トークンは、矢印(行i)が指す最上位ノードから始まります。コインを投げるたびに、トークンはそのコインの結果(HまたはT)のラベルが付いたエッジに沿って別のノード(それぞれ「Hノード」および「Tノード」と呼びます)に移動します。トークンがターミナルノードに着地すると(緑色の矢印は出ていない)、ゲームは終了し、FSAはシーケンスを受け入れました。

各FSAは、線形トラックを垂直方向に進んでいると考えてください。「正しい」一連の頭と尾を投げると、トークンは目的地に向かって進行します。「間違った」値を投げると、トークンがバックアップされます(または少なくとも停止します)。 トークンは、最新のトスに対応する最新の状態にバックアップします。 たとえば、ラインiiの HTT FSAは、ヘッドを見たときにラインiiに置かれたままになります。これは、そのヘッドが最終的なHTHの初期シーケンスになる可能性があるためです。この最後の頭を完全に無視するため、最初に戻ることはありませ

これらの2つのゲームが実際にHTTとHTHに対応していることを確認し、それらを行ごとに比較すると、HTHが勝ちにくいことが明らかになったはずです。HがHTTを行iiに戻す(およびTが受け入れる)行iiiでのみグラフィカルな構造が異なりますが、HTHでは、Tが行iに戻る(およびHが受け入れる)ようになります。 HTHをプレイする場合のiii行目のペナルティは、HTTをプレイする場合のペナルティよりも厳しいです。

これは定量化できます。 これら2つのFSAのノードには、受け入れに必要な予想トス数のラベルを付けました これらをノードを「値」と呼びましょう。ラベル付けは

(1)受け入れノードで明白な値0を書き込む。

頭の確率をp(H)、尾の確率を1-p(H)= p(T)としましょう。(公正なコインの場合、両方の確率は1/2になります。)コインフリップごとにトス数が1増えるため、

(2)ノードの値は、1にp(H)を掛け、Hノードの値にp(T)を掛け、Tノードの値を掛けた値になります。

これらのルールは値を決定します。ラベル付けされた値(公正なコインと仮定)が正しいことを確認するのは、迅速かつ有益な演習です。例として、行iiの HTHの値を考えます。ルールでは、8は8(行iの Hノードの値)および6(行iiiの Tノードの値)の平均よりも1大きくなければならないことが示されています:十分な8 = 1 +(1/2) * 8 +(1/2)* 6。図の残りの5つの値を簡単に確認できます。


FSAのアプローチは、Penneyのゲームを分析するのに最適な方法です(@Henryの回答)。値のラベルは少し異なります。FSAには、パターンごとに1つの受け入れノードがあります。パターンが勝つ可能性を見つけるには、受け入れノードに1のラベルを付け、他のすべての受け入れノードに0のラベルを付けます。他のノードの値は、そのHノードとTノードの値の平均に等しくなります。(一意の)開始ノードの値は、勝つ可能性です。
whuber

0

@gungそれをキャッチしてくれてありがとう。例を修正しました。しかし、図のタイプミスがあります:それは2ではなく、4でなければならない線IIIでHTTの値のように見える
whuber

4

いくつかの素晴らしい答え。私は少し異なるタックを取り、反直感性の問題に対処したいと思います。(私はまったく同意します、ところで)

ここに私がそれを理解する方法があります。「H」と「T」の文字で構成される、紙テープに印刷されたランダムな連続コイントス結果の列を想像してください。

このテープの一部を任意に切り取り、同一のコピーを作成します。

特定のテープでは、テープが十分に長ければ、シーケンスHTHとシーケンスHTTがそれぞれ頻繁に発生します。

ただし、HTHインスタンスが一緒に実行される場合があります(HTHTH)。(またはごくまれにHTHTHTH)

このオーバーラップは、HTTインスタンスでは発生しません。

蛍光ペンを使用して、成功した結果の「縞模様」、一方のテープのHTH、もう一方のテープのHTTを選択します。いくつかのHTHストライプは、オーバーラップのために短くなります。その結果、それらの間のギャップは、平均して、他のテープよりもわずかに長くなります。

平均して5分ごとにバスがあるので、バスを待つようなものです。バスが互いにオーバーラップできる場合、2つが一緒に通過するため、間隔は平均で5分よりわずかに長くなります。

任意の時間に到着すると、平均して次の(最初に)バスが重なることが許されていれば、それよりも少し長く待つことになります。


2

私は、ロスのイントロから確率モデルまでを追っているので、整数の場合にこれに対する直観を探していました。だから私は整数の場合について考えていました。私はこれが助けになったことがわかりました:

A

B

A=BP(AB~)=0

ABP(AB~)0

それで、次のドローでパターンを完成させるチャンスがあると想像してください。次のシンボルを描画しますが、パターンが完成しません。私のパターンが重ならない場合、描かれたシンボルにより、パターンの構築を最初からやり直すことができます。

オーバーラップの場合、部分的なパターンを完成させるために必要なシンボルは、再構築を開始するために必要なシンボルと同じでした。だから私もどちらもできないので、次のドローが再びビルドを開始するチャンスを得るまで絶対に待つ必要があります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.