IID一様ランダム変数のサンプルの最大値の確率密度関数をどのように計算しますか?


45

ランダム変数が与えられた場合

Y=max(X1,X2,,Xn)

どこXi IIDユニフォーム変数は、どのように私はのPDF計算しない、あるY


4
これが宿題の場合は、FAQを読んで、質問を適宜更新してください。
枢機

Vandermondeのアイデンティティを使用して、F_y(r)* G_y(r)と言う2次統計の共同関数を表示できますか?
ラリーミンツ

興味深いことに、この種の問題をどのコースで扱っていますか?私の工学確率コースで遭遇したことではありません。
アレックス

@Alexリサンプリングを扱う統計コースはどうですか?
SOFe

回答:


65

この質問は宿題である可能性がありますが、この古典的な初歩的な確率の質問は数か月後もまだ完全な答えを欠いていると感じたので、ここでそれをあげます。

問題文から、次の分布が必要です。

Y=max{X1,...,Xn}

ここで、はiidです。サンプルのすべての要素がより小さい場合にのみ、ことがわかります。次に、これは、@ _ vartyのヒントに示されているように、が独立しているという事実と組み合わせて、推測することができます。X1,...,XnUniform(a,b)Y<xxXi

P(Yx)=P(X1x,...,Xnx)=i=1nP(Xix)=FX(x)n

ここで、は均一分布のCDFです。したがって、のCDF は FX(x)Y

FY(y)=P(Yy)={0ya[(ya)/(ba)]ny(a,b)1yb

以来絶対連続分布を持っている私たちは、CDFを微分し、その密度を得ることができます。したがって、の密度はYY

pY(y)=n(ya)n1(ba)n

特別な場合、我々は持っているの密度であり、ベータ分布を用いて及び、。a=0,b=1pY(y)=nyn1α=nβ=1Beta(n,1)=Γ(n+1)Γ(n)Γ(1)=n!(n1)!=n

注として、サンプルを昇順でソートする場合に取得するシーケンス -はオーダー統計と呼ばれます。この回答の一般化は分散サンプルのすべての順序統計が、 @ bnaulの回答に記載されているようにベータ分布を持つことです。 X(1),...,X(n)Uniform(0,1)


これは実際には宿題の質問でした。説明ありがとう。
ポールPM

私はあなたの洞察をここで得てこの質問に答えるべきだと思うが、それを行う方法がわからない。あなたは私を助けることができます?この一般的な問題について説明している教科書や章を推奨できますか?

@PaulPM興味のないところで、どのようなコースがこの種の問題を扱っていますか?私の工学確率コースで遭遇したことではありません。
アレックス

6

サンプルの最大値は、順序統計の 1つ、特にサンプルの番目の順序統計です。一般に、Wikipediaの記事で説明されているように、順序統計の分布を計算することは困難です。いくつかの特別な分布では、順序統計はよく知られています(たとえば、ベータ分布の順序統計を持つ均一分布の場合)。nX1,,Xn

編集:サンプルの最大値と最小値に関するウィキペディアの記事も、問題に役立つ、より具体的なものです。


5
密度のある分布の場合、特定の次数統計の周辺分布の計算は非常に簡単です。最小値や最大値などの「特別な」順序の統計の場合はさらに簡単です。
枢機

元の質問の「計算」が何を意味するかによると思います。確かに数値的にそうすることは簡単です。この質問は、一般に簡単ではない、閉じた形式の解決策を見つける方法を尋ねていると解釈しました。
bnaul

8
@bnaul:レッツであり、任意の分布関数とせからIID試料で。ましょうあること順序統計番目。それからQEDF(x)=P(Xx)X1,,XnFX(k)k
P(X(k)x)=m=knP(|{i:Xix}|=m)=m=kn(nm)F(x)m(1F(x))nm.
枢機

1
おそらく、枢機inalの答えを理解する方法は(ユニフォームの順序統計を理解している場合)、cdfはユニフォームcdfの単調な1対1変換なので、ユニフォームに関してイベント{X <a}を常に表現できることです。ランダム変数(モンテカルロが機能する理由)したがって、一様分布に基づく結果は、他のランダム変数に簡単に一般化できます。変換適用するだけです。U=FX(X)
確率の

2
@probabilityislogic:直観は良いのですが、コメントには連続したランダム変数を念頭に置いているようです。(上記の私の第二のコメント、例えば、任意の分布関数のための作品で結果)
の枢機卿

1

場合のCDFである、次いで 次に、IIDプロパティを使用することができると計算するために、均一な変量のCDF。FY(y)Y

FY(y)=Prob(y>X1,y>X2,...,y>Xn)
FY(y)

-3

適切に正規化された一連のIIDランダム変数は、通常、3つの極値型のいずれかに収束します。これは、Gnedenkoの定理であり、極値に対する中心極限定理と同等です。特定のタイプは、母集団分布の尾の挙動に依存します。これを知っているので、制限分布を使用して最大値の分布を近似できます。

[a、b]の一様分布がこの質問の主題であるため、マクロは任意のnの正確な分布と非常に良い答えを与えました。結果はかなり簡単です。正規分布の場合、適切な閉形式は不可能ですが、正規の最大値を適切に正規化してガンベル分布F(x)= exp(-e)に収束します。x

ユニフォームの場合、正規化は(ba)-x / nおよびF(bax / n)=(1-x / [n(ba)])nn

これはe収束します。ここで、y = bax / nであることに注意してください。そして、F(y)はyがbaになると1に収束します。これはすべて0を保持します x/(ba)n

この場合、正確な値を漸近的制限と比較するのは簡単です。

ガンベルの本

ガランボスの本

リードベターの本

ノバクの本

コールズブック


4
この回答を実行可能にするには、値を「適切に正規化する」方法を詳細に規定する必要があります。また、漸近式が信頼できる近似になるまでの大きさを推定する方法を提供する必要があります。n
whuber

@whuber誰でもGnedenkoの定理を見て正規化を確認できます。同様に重要なのは、3つのタイプのどれが適用されるかを決定するテールの特性です。定理は定常確率過程に一般化されます。したがって、核心の詳細を知りたい人は、Leadbetterの本または私の博士論文を見ることができます。nが十分に大きい場合、どのような形の漸近線に対しても答えるのは難しい質問です。ベリー・エッセンの定理は中心極限定理に役立つと思います。極端なものに匹敵するものがわかりません。
マイケルチャーニック
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.