ワームとアップルの期待値


8

リンゴは五角形A B C D Eの頂点Aにあり、ワームは2つの頂点Cにあります。ワームは毎日、隣接する2つの頂点の1つと同じ確率でクロールします。したがって1日後にワームが頂点であるB又はD確率でそれぞれ、1 / 2。2日後、以前の位置の記憶がないため、ワームは再びCに戻る可能性があります。頂点Aに到達すると、食事を停止します。ABCDECBD1/2CA

(a)夕食までの日数の平均は何ですか?

(b)日数が100以上になる確率をpとする。マルコフの不等式はについて何と言っていpますか?

(a)について、X夕食までの日数で定義された確率変数とします。したがって、

P(X=0)=0P(X=1)=0P(X=2)=1(52)

一般的な分布はどうなりますか?

(b)の場合、(a)がわかっていれば、

P(X100)E(X)100

2
最初の方程式のセットを説明できますか?それらは、ワームが方向を逆転させる可能性を説明していないようであり、また正しいようにも見えません。結局のところ、は、確率を持つパスの可能性よりもはるかに小さい この質問の要点は、期待値を計算するよりも完全な分布を取得することが難しい場合があることです。それでもマルコフの不等式は、期待だけから有用な情報を導き出すことを可能にします。、ABCを1/21/2=1/4です。1/(52)=1/10ABC(1/2)(1/2)=1/4.
whuber

回答:


6

Glen_bの優れた回答では、線形方程式の単純なシステムを使用して分析的に期待値を計算できることを示しています。この分析メソッドに従うと、リンゴへの予想される移動回数は6回であると判断できます。whuberによる別の優れた答えは、任意の数の移動後のプロセスの確率質量関数を導き出す方法を示しています。また、この方法を使用して、期待値の分析ソリューションを取得することもできます。この問題についてさらに洞察を得たい場合は、循環ランダムウォークに関する論文を読んでください(たとえば、Stephens 1963を参照)。

問題の別の見方をするために、統計計算を使用してマルコフ連鎖を計算するだけの総当たり法を使用して同じ結果を得る方法を示します。この方法は多くの点で分析検査よりも劣りますが、大きな数学的な洞察を必要とせずに問題に対処できるという利点があります。


ブルートフォース計算方法:順に状態をとると、マルコフ連鎖は次の遷移行列に従って遷移します。A,B,C,D,E

P=[100001201200012012000120121200120]

最初の状態は、ワームがリンゴにある吸収状態です。してみましょうワームが状態からリンゴに達するまでの移動の数である。次に、すべての、この数の移動後にワームがリンゴにいる確率はなので、この状態からリンゴに到達するために予想される移動数は次のとおりです。ATCCnNP(TCn)={Pn}C,A

E(TC)=n=0P(TC>n)=n=0(1{Pn}C,A).

合計の項は、が大きいと指数関数的に減少するため、有限数の項で合計を切り捨てることにより、期待値を任意の精度レベルで計算できます。(用語の指数関数的減衰により、削除された用語のサイズを望ましいレベル未満に制限することができます。)実際には、残りの用語のサイズが非常に小さくなるまで、多数の用語を取得するのは簡単です。n


これをRでプログラミング:R以下のコードを使用して、これを関数としてプログラミングできます。このコードは、移動の有限シーケンスの遷移行列のべき乗の配列を生成するようにベクトル化されています。また、リンゴに到達していない確率のプロットを生成し、これが指数関数的に減少することを示しています。

#Create function to give n-step transition matrix for n = 1,...,N
#N is the last value of n
PROB <- function(N) { P <- matrix(c(1, 0, 0, 0, 0, 
                                    1/2, 0, 1/2, 0, 0, 
                                    0, 1/2, 0, 1/2, 0,
                                    0, 0, 1/2, 0, 1/2,
                                    1/2, 0, 0, 1/2, 0),
                                  nrow = 5, ncol = 5, 
                                  byrow = TRUE);
                      PPP <- array(0, dim = c(5,5,N));
                      PPP[,,1] <- P;
                      for (n in 2:N) { PPP[,,n] <- PPP[,,n-1] %*% P; } 
                      PPP }

#Calculate probabilities of reaching apple for n = 1,...,100
N  <- 100;
DF <- data.frame(Probability = PROB(N)[3,1,], Moves = 1:N);

#Plot probability of not having reached apple
library(ggplot2);
FIGURE <- ggplot(DF, aes(x = Moves, y = 1-Probability)) +
          geom_point() +
          scale_y_log10(breaks = scales::trans_breaks("log10", function(x) 10^x),
                        labels = scales::trans_format("log10", 
                                 scales::math_format(10^.x))) +
          ggtitle('Probability that worm has not reached apple') +
          xlab('Number of Moves') + ylab('Probability');
FIGURE;

#Calculate expected number of moves to get to apple
#Calculation truncates the infinite sum at N = 100
#We add one to represent the term for n = 0
EXP <- 1 + sum(1-DF$Probability);
EXP;

[1] 6

この計算からわかるように、リンゴに到達するための予想される移動回数は6回です。マルコフ連鎖に対して上記のベクトル化されたコードを使用すると、この計算は非常に高速でした。

ここに画像の説明を入力してください


5

すべてのマルコフ連鎖ルーチンを経​​由せずに、パート(a)を見る簡単な方法を説明したいだけです。気になる状態のクラスは2つあります。1ステップ離れていることと2ステップ離れていることです(CとDは、Aに到達するまでの予想されるステップに関して同一であり、BとEは同一です)。" "が頂点からのステップ数などを表すとしましょう。SBB

E(SC)=1+12[E(SB)+E(SD)]=1+12[E(SB)+E(SC)]

同様に、期待値の方程式を記述します。E(SB)

最初のものを2番目のものに(そして、便宜上、と書いて、解が数行で得られます。cE(SC)c


3
+1。私も開始状態のためPGFが等しいことを示し、同じように簡単に解決、あなたが同様の式を得る確率生成機能により期待を置き換えることにより、そのようなおよびそのリードを確率の単純な式に。より良い:をから始まるステップ数とします定義及び関係は、および後者を前者に代入すると、られしたがって、はt2/(42tt2),Xyy{A,B}.fn=2nPr(XA=n)gn=2nPr(XB=n).fn=fn1+gn1gn1=fn2.fn=fn1+fn2n3.fnn2ndフィボナッチ数。
whuber

@whuber:コメントを完全な回答に変える必要があります-本当に良いです。
ベン-モニカを復活させる'30年

1
この短い形式でも、回答として投稿する価値はあります。
Glen_b-モニカを復元する

3

問題

このマルコフ連鎖は、ワームがあるかどうかで区別三つの状態、持っているまたはのスペースから離れ レッツワームが到達するのにかかるどのように多くのステップを与える確率変数状態から それらの確率生成関数は、これらの変数の確率をエンコードする便利な代数的方法です。収束などの分析の問題について心配する必要はありません。それらを、式与えられたシンボル正式なべき級数として表示するだけです。0, 1,2C.XiCi{0,1,2}.t

fi(t)=Pr(Xi=0)+Pr(Xi=1)t1+Pr(Xi=2)t2++Pr(Xi=n)tn+

のでそれことが自明である を見つける必要がありますPr(X0=0)=1,f0(t)=1.f2.

分析と解決策

ワームは状態、状態戻る、または到達する確率がになります。この一歩を取るの会計処理追加のすべての権限に、等しいによってPGF乗算に与え、1,1/22C1tt

f1=12t(f2+f0).

同様に、状態からワームが等しい状態に滞在する機会有する又は状態到達そこを221,

f2=12t(f2+f1).

外観私たちの仕事は、変数導入することにより、容易に行われる示唆して与えますt/2x=t/2,

f1(x)=x(f2(x)+f0(x));f2(x)=x(f2(x)+f1(x)).

最初のものを2番目のものにを呼び出すと、f0=1

(*)f2(x)=x(f2(x)+x(f2(x)+1))

そのユニークなソリューションは

(**)f2(x)=x21xx2.

方程式 を強調して、その基本的な単純さと、予想される値のみを分析することで得られる方程式との形式的な類似性を強調しました。配布全体を取得します。()E[Xi]:

含意と単純化

同様に、が項ごとに書き出され、の累乗が一致する場合、()tn4,

2nPr(X2=n)=2n1Pr(X2=n1)+2n2Pr(X2=n2).

これは有名なフィボナッチ数列の繰り返しです

(Fn)=(1,1,2,3,5,8,13,21,34,55,89,144,)

(からインデックス付け)。解の一致は、このシーケンスを2桁シフトしたものです(または可能性はなく、であることを確認するのは簡単です)。n=0()X2=0X2=122Pr(X2=2)=1=23Pr(X2=3)

したがって

Pr(X2=n)=2n2Fn2.

すなわち、

f2(t)=22F0t2+23F1t3+24F2t4+=14t2+18t3+216t4+332t5+564t6+8128t7+13256t8+.

の期待値は、導関数を評価して置き換えることで簡単に見つかります。これは、(のべき乗を項ごとに微分する)これにより式X2ft=1,t

f(1)=Pr(X2=0)(0)+Pr(X2=1)(1)10++Pr(X2=n)(n)1n1+

これは、確率の合計にの値を正確に定義ですを 使用して導関数を取得すると、期待値の単純な式が生成されます。X2,E[X2].()


簡単なコメント

を部分分数として展開することにより、は2つの幾何級数の和として書くことができます。これにより、が指数関数的に減少する確率がすぐにます。また、テール確率閉形式も生成し これを使用すると、が未満であることをすばやく計算でき()f2Pr(X2=n)Pr(X2>n).Pr(X2100)109.

最後に、これらの式には黄金比 この数は、正五角形(ユニット側の)の弦の長さであり、五角形上の純粋な組み合わせマルコフチェーン(ユークリッド幾何学については何も知らない)と、ユークリッド平面。ϕ=(1+5)/2.


1

夕食までの平均日数は、初日にとった歩数を条件に。ましょワームはリンゴを取得するまでの日数なります。してみましょう最初のステップとなります。XF

次に、

E[X]=E[X|F=B] [P(F=B)]+E[X|F=D] P[F=D]

最初のステップが場合、ワームは2日目に確率2分の1でリンゴを取得するか、確率2分の1で頂点戻り、最初からやり直します。これは次のように書くことができますB,C

E[X|F=B]=2(12)+(2+E[X])(12)=2+E[X]2

最初のステップが場合、対称性により、ワームが単一のステップを実行したことを除いて、これは頂点あるのと同じです。D,C

E[X|F=D]=1+E[X]

すべてをまとめると、

E[X]=(2+E[X]2)(12)+(1+E[X])(12)

利回りの解決E[X]

E[X]=6

1
これは@Glen_bの答えを要約したようです。
whuber
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.