最大でクローズされた分布のクラス


11

レッツ非負実数の確率分布のクラスもによってパラメータだから、 ディストリビューションの既知のクラスがあれば最大値を取って、すなわち下に閉じている私の不思議とは独立していて、です。Qpp

Qp[0=1。
バツ1Qp1バツ2Qp2最高バツ1バツ2Qp

2
そのようなクラスの数学的特性を探していますか、または一般的に知られている分布のパラメトリックファミリーのどれがこの特性を持っているかについて問い合わせていますか?
whuber


@whuber 3つの極値タイプはすべて、以下に示す引数によって機能します。私はそれらが唯一のものであることを示していません。
Michael R.Chernick

whuberが引用しているStoevのパワーポイントは、maxya-stableと呼ばれるllyaが記述したこれらの分布に対して私が与えた結果を示しており、プレゼンテーションで引用されている定理は、それらが唯一のものであると述べています。
Michael R. Chernick

@Michael質問で負でない値への制限に気づきましたか?これにより、負の実数を正にサポートする極値分布が除外されます。
whuber

回答:


12

極端な値の分布を提案することは、実際には別の質問に答えるように思えます。この質問に直接対処し、それを示すことで、極値型ではない分布につながることを示します。

これを第一原理から考えましょう。 確率の公理とCDFの定義から、CDFがとの2つの独立確率変数の最大値の分布は、そのCDFに対してを持つことがすぐにわかります。ペアワイズ最大値の下で閉じている分布のクラスが存在するとします。あれは、F 2 F 1 F 2 Ω = { Fのθ }F1F2F1F2Ω={Fθ}

FθΩ FφΩ 意味する FθFφΩ

対数を取ると便利です(Rudinの高度な分析テキストのように)をの対数として含めるために実数を拡張します。基本的にサポートされている確率変数のCDFのログは(i)単項で増加しない、(ii) onに等しい、(iii)右限界が、および( iv)カドラグです。この観点から、は上のカドラグ関数の空間内の円錐の凸サブセットである必要があります。有限にパラメーター化するには、その円錐が有限次元のベクトル部分空間を生成する必要があります。それはまだ多くの可能性を残します。0 [ 0 0[0- 0 0 Ω R00ΩR

これらの可能性のいくつかはよく知られています。 たとえば、一様変数のCDFを考えます。そのCDFに等しいに、、およびに。生成されるコーンは、フォームのCDFのセットです。0 - 0[01]0X 0 X 1 1 [ 1 0]バツ0バツ11[1

Fθバツ=expθログバツ=バツθ0<バツ<1

によってパラメータ化されます。明らかに、このファミリーに分布を持つ2つの独立確率変数の最大値には、このファミリーにも分布があります(それらのパラメーターは単純に追加されます)。必要に応じて、形式の凸型サブセットに制限することができますあり、なおかつ最大クローズのファミリーを持っています。このファミリのどのメンバーも極値分布ではないことに注意してください。{ Fのθ | θ θ 0 }θ>0{Fθ|θθ0}

この定式化には、離散分布が含まれます(これは、明らかに3つのタイプの極値分布には含まれません)。たとえば、確率が次のように与えられる自然数でサポートされる分布を考えます。012k

Prθk=θ1/k+1θ1/k

(撮影場合)によってパラメータ、。構造上、CDF、その後は、K = 0 0 < θ < 1θ1/k=0k=00<θ<1Fθk=θ1/k+1

Fθ(k)Fϕ(k)=θ1/(k+1)ϕ1/(k+1)=θφ1/k+1

そして、仮定は意味するので、これはファミリーがペアワイズ最大値の下で閉じていることを示しています。0<θφ<1

この分析とこれら2つの例が、コメントで表明された意見に反して、有限数の適切に選択されたCDFから始めてペアワイズ最大値に関してそれらを閉じる(つまり、それらのコーンを形成する)アプローチを示していることを願っています適切な関連するベクトル空間で)は建設的であるだけでなく、興味深い、潜在的に有用な分布のクラスを生み出します。


3
この分析の+1と極値分布の解釈のチェック。

1
@whuber:この問題に注意を払ってくれて本当にありがとう、私は本当に良い答えをあまり期待していませんでした(そして私は答えたすべての人に挨拶します)。あなたが与えた円錐(または半群)構成は実際に真です:が分布のファミリーである場合、その閉包(wrt)はの形式のすべての要素を持ちますここで、およびです。残念ながら、私は閉鎖WRTシフトも必要とされていることに気づいた(つまり、もしその後、)。これについて新しい質問をする必要がありますか?Fθmax(Fθ1α1××Fθnαn)αi0nNF(x)ΩF(xa)Ω
イリヤ

1
それは確かに複雑です、イリヤ。ただし、何かを変更したり、新しい質問を投稿したりする前に、すべての変数が負でないサポートを持つという(明らかに矛盾する)要件とシフトクロージャの要件をどのように調整するかを検討してください!(の可能な値を制限する必要があると思います。)a
whuber

この質問とは関係ありませんが、製品の下で安定している家族の例を探しています。
ヴィンセントグランビル

1
@Vincentまず、加法的に閉じた確率変数のファミリーを検討し、それらをべき乗します。より豊富なファミリの場合、これらの変数のいずれかに独立したRademacher変数掛けます(正の数値だけでなく、実際の行全体でサポートされる変数を取得します)。U
whuber

10

注:この答えは、変数がされていると仮定し、同一ちょうど同じクラスに応じて分配されない、分散。

それらは極値分布になります。それらは通常提示されるように3つあり、最大の制限分布が見つかる基礎となる分布の3セットの条件に対応します。彼らはあなたが望むものである最大値を見つけることで閉じられます。

古いバージョンの信頼性と寿命のデータの統計分析方法(Mann、Schafer、Singpurwalla)からの多かれ少なかれコピー

タイプI: FX(n)(x)=exp{exp[xγα]}, <x<, α>0

タイプII: FX(n)(x)=exp{(xγα)β}, xγ, α,β>0

タイプIII: FX(n)(x)=exp{[(xγα)β]}. xγ, α,β>0

編集:コメントを読んで、この回答を拡張して、この質問に対する大幅に改善されたより完全な回答を作成してください


3
+1しかし、タイプIおよびタイプIIIは質問には適用されません。
whuber

かなり真実(+1)で、違いを説明せずに、より一般的な質問に答えていました。また、以下のMCの回答に対するコメントで行ったように、縮退を防ぐために発生する必要がある正規化についても説明しました。ドアから出ようとしているときに、これらの答えを書くように教えてください!(まあ、多分そうではない... :)
jbowman '16

1
@whuber私はおそらく何か明白なことを求めていますが、およびあり、それらが独立している場合、?X 2F R E C H E T α 2β 2mは、X X 1X 2F のR EのCのH EのT α 3β 3X1Frechet(α1,β1)X2Frechet(α2,β2)max(X1,X2)Frechet(α3,β3)

2
@Procrastinator、それは素晴らしい質問です。このような結果が真になる理由は何も考えられなかったので、Frechetからの1,000,000個のiid値とFrechetからの1,000,000個のiid値をシミュレートし、それらのペアワイズ最大値を計算しました。結果は、Frechet分布では近似できません。このファミリーを最大値で閉じるには、3つのパラメーター(locationパラメーターを含む)がすべて必要です。次に、Michael Chernickの返答で(不完全な)引数をエミュレートします。はスケーリングされたFrechetをシフトする必要があることを示すことができます。10 1 α β マックスX 1X 2(3,1)(10,1)(α,β)max(X1,X2)
whuber

この答えは間違っています。極値の定理は、変数の分布が同一である場合に適用されますが、質問は、それらが同じクラスに属していればよい(パラメーターが異なる可能性がある)ことを示しています。
user76284

0

jbowmanが答えに私を殴った。それらが機能する理由の説明は、Gnedenkoの定理が、が独立した同一に分布された確率変数のシーケンスである場合、は、分布は、jbowmanが回答にリストした3つのタイプの1つに収束します。タイプI、タイプII、またはタイプIIIの分布はシーケンスの最大値の限界として表現できるため、がタイプIであり、として無限大になる傾向と I型もあり、限界であるX1,,XnnMn=max(X1,X2,,Xn)G1Mn=max(X1,X2,,Xn)nG2Nn=max(Y1,Y2,dotsc,Yn)V n = max M nN nG 3 n V n G 3 G 1 G 2次に言うとような限界の分布であるのための無限大に近づく次いで分布とRVの最大のための分布Iを入力することであろう分布を有する、別とをしたがって、タイプIは最大化の下で閉じられます。タイプIIとタイプIIIについても同じことが言えます。Vn=max(Mn,Nn)G3nVnG3G1G2


2
無制限の分布の場合、最大値は収束しませんで発散します。CLTと同様に、適切な正規化が必要です。(これが、これらのファミリに位置とスケールのパラメータを含めることが不可欠である理由です。)Gnedenkoの主題に関する古典的な論文は、(正しく思い出せば)ような一連のアフィン係数が見つかるかどうかを尋ねることから始まります収束します。これを確立した後、彼は可能な分布を制限する可能な形式を取得します。a nb n a M n + b nnan,bnaMn+bn
whuber

すべての場合において、私は適切に正規化されていると言うべきでした。ありがとう。境界のある場合でも、制限を取得するために正規化する必要があります(私はこれを覚えておくべきだと思います。私の論文は極端でした!しかし、34年前)
Michael R. Chernick

3
また、極値分布は質問に完全には答えていません。(これは批判ではなく、単なる観察です。)たとえば、を自然数に制限することで、を上の均一分布と定義できます。このクラスは最大値()で閉じられていますが、極値分布ではありません。Q P [ P P + 1 ] 最大Q 、PQ 、RQ マックスP R pQp[p,p+1]max(Qp,Qr)Qmax(p,r)
whuber

@whuber 3つのタイプはすべて無制限のケースですが、短いテールのタイプIIIには一様分布のような制限付きのケースが含まれます。U [0,1]の場合、P [Mn <= 1-x / n] =(1-x / n)^ nなので、P [Mn <= 1-x / n]はexp(-x)に収束します。
Michael R. Chernick

3
マイケル、あなたの返答は私が挙げた例には関係がないようです。違いは、この質問はiid変数の数え上げ可能なシーケンスまたは何かの数え上げ可能なシーケンスについても尋ねていないことです。通常は異なる分布を持つ変数のペアの下でのクロージャについてのみ尋ねています。(しかし、今の例には欠陥があることがわかりますが均一でなくなったときの最大値です。そのため、ファミリを適切に拡大して、任意の数のp=r
iid
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.