@Glen_bから提供された情報で、答えを見つけることができました。質問と同じ表記法を使用する
P(Zk≤ X )= Σj = 0k + 1( k+1j)(−1)j(1 − j x )k+、
ここa+= a場合a > 0と0そうでありません。また、Gumbel(NB:Betaではなく)分布に期待と漸近収束を与えます
E(Zk)= 1k + 1∑i = 1k + 11私〜ログ(k + 1 )k + 1、P(Zk≤ X )〜EXP( − e− (k + 1 )x + log(k + 1 ))。
証拠の資料は、参考文献にリンクされているいくつかの出版物から取られています。それらはやや長めですが、簡単です。
1.正確な分布の証明
してみましょう区間内のIID一様ランダム変数である。それらを順序付けることにより、と示される順序統計 を取得します。は、として定義され、およびです。順序付けられた間隔は、対応する順序付けられた統計です。対象の変数はです。(0 、1 )、K (U (1 )、... 、U (K ))Δ I = U (I ) - U (I - 1 ) U (0 ) = 0 U (K + 1 ) = 1 Δ (1 ) ≤(U1、… 、Uk)(0 、1 )k(U(1 )、… 、U(k ))△私= U(i )− U(i − 1 )うん(0 )= 0うん(k + 1 )= 1 Δ (K + 1 )△(1 )≤…≤Δ(k+1)Δ(k+1)
固定場合、インジケーター変数を定義します。対称性により、ランダムベクトルは交換可能であるため、サイズサブセットの共同分布は、次の共同分布と同じです。最初の。製品を拡張することにより、こうして得られます1 iは = 1 { Δ I > X }(1 1、... 、1 、K + 1)jはjはx∈(0,1)1i=1{Δi>x}(11,…,1k+1)jj
P(Δ(k + 1 )≤ X )= E(Πi = 1k + 1(1 − 1私)) = 1 + ∑j = 1k + 1( k+1j)(−1)jE(Πi = 1j1私)。
であることを証明します。これにより、上記の分布が確立されます。一般的な場合も同様に証明されるため、についてこれを証明します。 j = 2E(Πji = 11私) =(1−jx)k+j = 2
E(Πi = 121私) =P(Δ1>x∩Δ2>x)=P(Δ1>x)P(Δ2>x|Δ1>x).
場合、ブレークポイントは、間隔にある。このイベントの条件付きで、ブレークポイントはまだ交換可能であるため、2番目と1番目のブレークポイント間の距離がよりも大きい確率は、最初のブレークポイントと左バリア(距離)間の距離と同じ確率ですよりも大きい。そうK (X 、1 )X X XΔ1>xk(x,1)xxx
P(Δ2>x|Δ1>x)=P(all points are in (2x,1)∣∣all points are in (x,1)),soP(Δ2>x∩Δ1>x)=P(all points are in (2x,1))=(1−2x)k+.
2.期待
サポートが有限のディストリビューションの場合、
E(X)=∫P(X>x)dx=1−∫P(X≤x)dx.
分布積分、我々が入手しますΔ(k+1)
E(Δ(k+1))=1k+1∑j=1k+1(k+1j)(−1)j+1j=1k+1∑j=1k+11j.
最後の等式は、調古典的な表現です。これを以下に示します。Hi=1+12+…+1i
Hk + 1= ∫101 + x + … + xkdx = ∫101 - xk + 11 - xdx 。
変数を変更し、製品を展開すると、次のようになります。u = 1 − x
Hk + 1= ∫10∑j = 1k + 1( k+1j)(−1)j + 1あなたはj − 1du = ∑j = 1k + 1( k+1j)(−1)j + 1j。
3.等間隔の代替構造
最大のフラグメントの漸近分布を取得するには、指数変数を合計で除算した均一な間隔の古典的な構成を示す必要があります。関連する順序統計の確率密度 は(U(1 )、… 、U(k ))
fうん(1 )、… U(k )(あなた(1 )、… 、u(k ))= k !、0 ≤ U(1 )≤ ... ≤ U(k + 1 )。
を示す場合、で、を取得します。△私= U(i )− U(i − 1 )うん(0 )= 0
f△1、… Δk(δ1、… 、δk)= k !、0 ≤ δ私+ … + δk≤1 。
定義することにより、次のようになります。うん(k + 1 )= 1
f△1、… Δk + 1(δ1、… 、δk + 1)= k !、δ1+ … + δk= 1。
ここで、を平均1のIID指数確率変数とし、ます。変数を簡単に変更すると、次のことがわかります。(X1、… 、Xk + 1)S= X1+ … + Xk + 1
fバツ1、… Xk、S(x1、… 、xk、s )= e− s。
定義し、変数を変更することで取得するようにしますY私= X私/ S
fY1、… Yk、S(y1、… 、yk、s )= ske− s。
この密度をに関して積分すると、次のようになります。s
fY1,…Yk,(y1,…,yk)=∫∞0ske−sds=k!,0≤yi+…+yk≤1,and thusfY1,…Yk+1,(y1,…,yk+1)=k!,y1+…+yk+1=1.
そのため、間隔上の均一な間隔の結合分布は、指数ランダム変数の結合分布を合計で割ったものと同じです。次の分布の等価になりますk+1(0,1)k+1
Δ(k+1)≡X(k+1)X1+…+Xk+1.
4.漸近分布
上記の等価性を使用して、以下を取得します
P((k+1)Δ(k+1)−log(k+1)≤x)=P(X(k+1)≤(x+log(k+1))X1+…+Xk+1k+1)=P(X(k+1)−log(k+1)≤x+(x+log(k+1))Tk+1),
ここで、です。この変数は、および。漸近的に、分布はの分布と同じです。はIIDであるため、Tk+1=X1+…+Xk+1k+1−1E(Tk+1)=0Var(log(k+1)Tk+1)=(log(k+1))2k+1↓0X(k+1)−log(k+1)Xi
P(X(k+1)−log(K + 1 )≤ X )= P(X1≤ X + ログ(k + 1 ))k + 1= ( 1 − e− x − ログ(k + 1 ))k + 1= ( 1 − e− xk + 1)k + 1〜EXP{ − e− x}。
5.グラフィカルな概要
以下のプロットは、異なる値に対する最大フラグメントの分布を示しています。以下のために、私はまた、漸近ガンベル分布(細線)を重ねてきました。Gumbelは小さな値の非常に悪い近似なので、画像を過負荷にしないためにそれらを省略します。ガンベル近似はから良好です。kK = 10 、20 、50kK ≈ 50
6.参照
上記の証明は参考文献2および3から取られています。引用文献には、任意のランクの順序付けられた間隔の分布、それらの制限分布、および順序付けられた均一な間隔のいくつかの代替構造など、さらに多くの結果が含まれています。キー参照には簡単にアクセスできないため、全文へのリンクも提供します。
- バイラモフ等。(2010)規則正しい間隔の制限結果、Stat論文、51:1、pp 227-240
- ホルスト(1980)ランダムに壊れた棒の破片の長さについて、 J。Appl。Prob。、17、pp 623-634
- Pyke(1965)Spacings、JRSS(B)27:3、pp。395-449
- Renyi(1953)オーダー統計の理論について、Acta math Hung、4、pp 191-231