Brain-teaser:均一な[0,1]分布から引き出されたときに単調に増加しているiidシーケンスの予想される長さは何ですか?


28

これは、ここで報告されている定量アナリストの立場に対するインタビューの質問です。均一な分布から描画し、描画がiidであると仮定すると、単調に増加する分布の予想される長さは何ですか?つまり、現在の描画が前の描画以下である場合、描画を停止します。[0,1]

最初の数個を取得しました: \ Pr (\ text {length} = 2)= \ int_0 ^ 1 \ int_ {x_1} ^ 1 \ int_0 ^ {x_2} \ mathrm {d} x_3 \、\ mathrm {d} x_2 \、\ mathrm {d} x_1 = 1/3 \ Pr(\ text {length} = 3)= \ int_0 ^ 1 \ int_ {x_1} ^ 1 \ int_ {x_2} ^ 1 \ int_0 ^ {x_3} \ mathrm {d} x_4 \、\ mathrm { d} x_3 \、\ mathrm {d} x_2 \、\ mathrm {d} x_1 = 1/8

Pr(length=1)=010x1dx2dx1=1/2
Pr(length=2)=01x110x2dx3dx2dx1=1/3
Pr(length=3)=01x11x210x3dx4dx3dx2dx1=1/8

しかし、これらのネストされた積分の計算はますます難しくなり、Pr(length=n)に一般化する「トリック」が得られません。最終的な答えが構造化されていることはわかっています

E(length)=n=1nPr(length=n)

この質問に答える方法についてのアイデアはありますか?

回答:


37

この質問を解決するための一般的なヒントを次に示します。

連続したIIDランダム変数のシーケンスがあるため、それらは交換可能です。これは、最初のn値に対して特定の順序を取得する確率について何を意味しますか?これに基づいて、最初のn値が昇順になる確率はどのくらいですか?基になる確率変数の分布を統合することなく、これを把握することができます。これをうまく行えば、均一な分布を仮定せずに答えを導き出すことができます。つまり、連続したランダム変数の交換可能なシーケンスに適用される答えを得ることができます。


完全な解決策は次のとおりですこれを自分で理解することになっているかどうかは見てはいけません

レッツ独立した連続確率変数のあなたのシーケンスである、と聞かせては、シーケンスの開始時に増加する要素の数です。これらは連続的に交換可能なランダム変数であるため、ほぼ確実に互いに等しくなく、順序付けも同様に可能性が高いため、次のようになります。 (この結果は、連続ランダム変数のIIDシーケンスに適用されることに注意してください。一様分布である必要はありません。)ランダム変数は確率質量関数があります。U1,U2,U3,IID Continuous DistNmax{nN|U1<U2<<Un}

P(Nn)=P(U1<U2<<Un)=1n!.
p Nn = PN = n = 1NEN=Σ N=1つのPNN=Σ N=11
pN(n)=P(N=n)=1n!1(n+1)!=n(n+1)!.
この結果は、基礎となる値の積分を使用して計算した値と一致することに気付くでしょう。(この部分はソリューションには必要ありません。完全を期すために含まれています。)非負のランダム変数期待値に既知の規則を使用すると、次のようになります。 繰り返しますが、基礎となる一様分布を使用した作業は何もないことに注意してください。したがって、これは、連続ランダム変数の交換可能なシーケンスに適用される一般的な結果です。
E(N)=n=1P(Nn)=n=11n!=e1=1.718282.

さらなる洞察:

上記の作業から、この分布結果と結果の期待値は、連続分布である限り、基礎となる分布に依存しないことがわかります。これは、すべての連続スカラー確率変数が、一様なランダム変数の単調な変換を介して取得できるという事実を考慮すれば、驚くべきことではありません(変換はその変位値関数です)。単調変換はランク順を保持するため、任意のIID連続確率変数の順序付けの確率を調べることは、IID 一様確率変数の順序付けの確率を調べることと同じです。


6
よくできました!(+1)
jbowman

1
@Ben最後の方程式まで続きます...期待される値は、 ...この部分について詳しく説明してください。E N = Σ N = 1つの P N N
E(N)=n=1P(N=n)n=n=1n2/(n+1)!
E(N)=n=1P(Nn)
アマゾンの

5
これは、負でない確率変数の期待値に関するよく知られた規則です。合計の順序を入れ替える手法を使用すると、次のようになります。 したがって、ことがわかります。n 1
E(N)=n=1nP(N=n)=n=1k=1nP(N=n)=n=1k=nP(N=k)=n=1P(Nn).
n1n!=nn2(n+1)!
モニカの

理由を詳しく説明してください。P(Nn)=P(U1<U2<<Un)
badmax

1
@badmax:ランダム変数は、シーケンスの開始時のの増加要素の数です(その定義を参照)。したがって、場合、シーケンスの開始時に少なくとも要素が増加することを意味します。これは、最初の要素がなければならないことを意味します。U N NUN N U 1 < U 2 < < U NNnnnU1<U2<<Un
モニカを

8

より一般的なケースの解決策を得る別の解法。

がような単調シーケンスの予想される長さであると仮定します。計算する値はです。そして、を知ってい。次の値の条件付け、{ X 1はxは2} X X 1X 2F 0 )、F 1 = 0F(x){x1,x2,...}xx1x2F(0)F(1)=0

F(x)=0xπ(y)0dy+x1π(y)(1+F(y))dy=x11+F(y)dy

ここで、はU [0,1]密度です。そうπ(y)=1

F(x)=(1+F(x))

境界条件で解くと、ます。したがって、です。F(1)=0F(x)=e(1x)1F(0)=e1


2
これは非常に賢い方法です。ちょっと説明してください:あなたの観察は、1)が最長の最初の増加シーケンスの長さから1を引いたものであれば、を決定してを設定するのに十分です、及び2)あればゼロであるとさもなければ。以降我々が得る、これは均一な場合には直接解くことができます。LE(L|X0=x)=:F(x)x=0E(L|X0=x,X1=y)y<x1+E(L|X0=y)E(L|X0=x)=E(E(L|X0=x,X1))=RfX(y)E(L|X0=x,X1=y)dy=x1fX(y)(1+E(L|X0=y))dy=x1fX(y)(1+F(y))dyF(x)=fX(x)(1+F(x))
マシュータワーズ

2
+1とても賢い。しかし、最終的な答えは分布に依存しないため(他の答えで説明しているように)、この計算も何らかの形で依存しないはずです。それを見る方法はありますか?@m_t_へのCC。π(y)
アメーバは、モニカを復活

3
@amoebaはの分布に依存するべきではないことに同意しますが、他の値はそうすべきです。そのDEの一般的な解はF(0)XFF=Ceπ1
マシュータワーズ

1
@MartijnWeterings 1 ではなく、であると思います。たとえば、均一なケースではC=eeex1
マシュータワーズ

1
はい、あなたは正しいです。私は私のステートメントを推定する均一な場合に使用されるが誤って使用されの代わりに、ce1x1cex1
セクストス・エンペイリコス

0

別の解決方法は、積分を直接計算することです。

増加部分の長さがであるシーケンスを生成する確率は。ここで、。nfn(0)fn(x)=x1x11x21...xn21xn11dxndxn1...dx2dx1

行う必要があるのは、を計算することです。fn(0)

最初のいくつかのを計算しようとすると、おそらくfn(x)fn(x)=t=0n(x)tt!(nt)!

基本ケース:場合、n=1f1(x)=t=01(x)tt!(nt)!=1x=x1dx1

帰納仮説:場合、n=kfn(x)=t=0k(x)tt!(kt)! , for k1

誘導ステップ:場合、n=k+1

     fn(x)=fk+1(x)=x1fk(x)dx

=x1t=0k(x)tt!(kt)!dx

=t=0k(x)t+1t!(kt)!×(t+1)|x1=t=0k(x)t+1(t+1)!(kt)!|x1

=t=1k+1(x)tt!(kt+1)!|x1

=t=1k+1(1)t+1t!(kt+1)!+t=1k+1(x)tt!(kt+1)!

=t=1k+1(1)t+1Ctk+1(k+1)!+t=1k+1(x)tt!(kt+1)!

=1(k+1)!+t=0k+1(1)t+1Ctk+1(k+1)!+t=1k+1(x)tt!(kt+1)!

=1(k+1)!(11)k+1(k+1)!+t=1k+1(x)tt!(kt+1)!

=t=0k+1(x)tt!(kt+1)!

数学的帰納法により、仮定が成り立つ。

したがって、fn(0)=1n!

したがって、E(length)=n=1Pr(lengthn)=n=11n!=e1

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.