もし、


9

:次の設定を想定し
ましょZi=min{ki,Xi},i=1,...,n。また、XiU[ai,bi],ai,bi>0。さらに、ki=cai+(1c)bi,0<c<1すなわちkiは、それぞれのサポートの境界の凸状の組み合わせです。cはすべてのiに共通ですi

私は考えて私が持っているの分布Zi権利を:それは混合分布
連続部分

Xi[ai,ki),Zi=XiPr(Zizi)=ziaibiai
あり、不連続部分と離散部分があります。確率質量集中:
Pr(Zi=ki)=Pr(Xi>ki)=1Pr(Xiki)
=1kiaibiai=1(1c)(biai)biai=c

したがって、全体として

FZi(zi)={0zi<aiziaibiaiaizi<ki1kizi

一方、「離散/連続」質量/密度関数の混合の場合、区間[a_i、k_i]の外側では0であり、均一なU(a_i、b_i)\ frac {1}の密度である連続部分があります。 {b_i-a_iを}しかしためa_iを\ルz_i <K_I、それが正の確率質量集中C> 0z_i = K_I[ai,ki]U(ai,bi)1biaiaizi<kic>0zi=ki

総じて、それは現実を統一することを意味します。

確率変数S_n \ equiv \ sum_ {i = 1} ^ n Z_iの分布および/またはモーメントをn \ rightarrow \ inftySni=1nZiとして導出したり、それについて何かを述べたりしたい。n

、が独立している場合、 asます。近似としても、その部分を「無視」できますか?次に、間隔範囲のランダム変数が残され、 "無検閲"になる途中の検閲された制服の合計のように見えるため、おそらくいくつかの中心極限定理...だから、何か提案はありますか?XiPr(Sn=inki)=cn0n[i=1nai,i=1nki)

PS:この質問は関連しており、打ち切り変数の合計の分布を導き出しますが、@ Glen_bの答えは私が必要とするものではありません。これは研究なので、宿題のように扱ってください。一般的な提案や文献への参照で十分です。


あなたがそれを必要とする場合、分布書き込みよう適当で、、ここではボレル集合です。ZiμZi(B)=P(ZiB)=Bg(t)dt+cIB(ki)gB

@禅私はすでに配布が不連続であるという質問で書いた。またのRHSこのことを、それが明らかになり、密度の略が、確率のため私はコンパクトな表記を好むん-そして。ff[ai,ki)ki
Alecos Papadopoulos 2014

私の知る限り、この表記はpdfであり、pmfは存在しません。混合分布を正確に記述するための適切な数学言語があります。あなたが研究を発表するとき、この表記法は受け入れられないと思います。もちろん私の意見です。あなたはいつも好きなようにそれをするべきです。f

@Zen Publishingははるかに先を行っています。実際、レビュー担当者は、確立されていない表記法を見ると眉をひそめます。これは、多くの行で段階的な分布を記述したい場合の単なる省略形です。たとえば、以前のコメントで使用したような、確立された表記法に対する「賛成意見」はありません。
Alecos Papadopoulos 2014

回答:


5

私はヘンリーのヒントに従って、 Lyapunovをチェックします。とが適切に動作する限り、分布が混在しているという事実は問題になりません。各、、である特定のケースのシミュレーションは、正規性が良いことを示しています。δ=1aibiai=0bi=1ki=2/3i1

xbar <- replicate(10^4, mean(pmin(runif(10^4), 2/3)))
hist((xbar - mean(xbar)) / sd(xbar), breaks = "FD", freq = FALSE)
curve(dnorm, col = "blue", lwd = 2, add = TRUE)

CLT


確かにかなり正常です。知ってよかった。CLTの通常の状態はここでは問題になりませんでした。私の質問は、漸近的な結果を歪め、変更されたCLTを必要とする他の、おそらく微妙な問題があるかどうかでした。実際のシミュレーションでは、合計に入る変数が増えるにつれて、離散的な不連続性の確率が無視できる程度になることが示されています。
Alecos Papadopoulos 2014

特にありませんが、問題はありません。インデックスなく、それらも同様に動作する有限数と考えてください。それらは、が大きくなるにつれて増加または減少する可能性があり(特定の規則はありません)、それらのどれも他のものよりも過度に大きいわけではありません...それでも、「比較可能な」エンティティのサイズの違いを表します。したがって、リンデバーグの状態は最も確実に保持されますii
Alecos Papadopoulos '26 / 04/14

いいね。次のステップで頑張ってください。興味深い問題のようです。
Zen

3

ヒント:

仮定すると、固定されており、平均あなたが計算することができる独立している及び分散それぞれの例えば:そしてあなたはを知っています。 cXiμiσi2Ziμi=E[Zi]=cai+ki2+(1c)kiki=cai+(1c)bi

次に、とがあまり速く成長しない場合は、リアプノフまたはリンデバーグ条件を使用して、という結論で中心極限定理を適用できますは、標準の正規分布に収束するか、または手を振る意味で収束しますは、平均ほぼ正規分布しますと分散。aibi11nσi2(1nZi1nμi)1nZi1nμi1nσi2


ありがとう。とは問題はありません。これらはインデックスと共に成長せず、変動します。つまり、CLTは混合分布の確率変数もカバーできると本質的に言っているのですか。aibi
Alecos Papadopoulos 2014

たとえば、とが固定されている場合、有限分散を持つ独立して同一に分布した確率変数があるため、中心極限定理が適用されます。これが混合分布であるかどうかは、この結果には影響しません。私が言っているのは、平均と分散が妥当なままであれば、確率変数が独立しているが同一に分布していない場合にこれを拡張できるということです。aibi
ヘンリー

2

この質問での私の主な心配は、私が調査している場合に「通常どおり」CLTを適用できるかどうかでした。ユーザー@Henryは、ユーザー@Zenがシミュレーションでそれを表示できると主張しました。このように励まされて、私は今それを分析的に証明します。

私が最初にやろうとしていることは、混合分布を持つこの変数が「通常の」モーメント生成関数を持っていることを確認することです。示すの期待値、その標準偏差との中心とスケーリングされたバージョンによって。 変更の可変式を適用我々は、連続部であることが判明 の積率母関数は μiZiσiZiZ~i=Ziμiσi

fZ~(z~i)=σifZ(zi)=σibiai
Z~i
M~i(t)=E(ez~it)=ez~itdFZ~(z~i)=a~ik~iσiez~itbiaidzi+cek~it

M~i(t)=σibiaiek~itea~itt+cek~it
k~i=kiμiσi,a~i=aiμiσi

素数を使用して導関数を表す場合、モーメント生成関数を正しく指定していれば、を取得する必要があり 以降この中央揃えでスケーリングされた確率変数です。 実際、導関数を計算し、L'Hopitalのルールを度も適用して(ゼロでのMGFの値は制限を通じて計算する必要があるため)、代数的操作を行うことで、最初の2つの等式を検証しました。3番目の平等は面倒すぎることがわかりましたが、私はそれが成り立つと信じています。

M~i(0)=1,M~i(0)=E(Z~)=0M~i(0)=E(Z~i2)=Var(Z~i)=1

したがって、適切なMGFがあります。2次のテイラー展開をゼロに近づけると、

M~(t)=M~(0)+M~(0)t+12M~(0)t2+o(t2)

M~(t)=1+12t2+o(t2)

これは、特性関数が(ここでは虚数単位を表す)である ことを意味します。i

ϕ~(t)=1+12(it)2+o(t2)=112t2+o(t2)

特性関数の特性により、の特性関数は、Z~/n

ϕ~Z~/n(t)=ϕ~Z~(t/n)=1t22n+o(t2/n)

独立したランダム変数があるため、の特性関数 は1ninZ~i

ϕ~1ninZ~i(t)=i=1nϕ~Z~(t/n)=i=1n(1t22n+o(t2/n))

その後

limnϕ~1ninZ~i(t)=limn(1t22n)n=et2/2

よる番号どのように表されますe。たまたま、最後の項は標準正規分布の特性関数であり、レビーの連続性定理により、

1ninZ~idN(0,1)

これはCLTです。変数が同一に分布されていないという事実は、それらの中心化およびスケーリングされたバージョン検討し、MGF / CHFの2次テイラー展開を検討すると、ビューから「消える」:その近似レベルで、これらの関数は同一であり、すべての違いは漸近的に消える残りの項で圧縮されます。 Z

それでも、平均的な振る舞いを考えると、すべての個々の要素からの個々のレベルでの特異な振る舞いが消えるという事実は、混合分布を持つランダム変数のような厄介な生き物を使用すると非常によく示されると思います。


本当にクールなAlecos。私の考えでは、引数はとのより具体的な条件に依存する必要があります。たとえば、場合、証明はすぐに壊れますか?(私はあなたのアプリケーションではこれが起こらないことを知っています。)あなたはどう思いますか?aibi(biai)0

@Zen独立しているが等しく分布していないrvの分散に関する問題は非常に微妙な問題であり、まだ明確に理解していません。既知のリアプノフまたはリンデバーグの条件は、CLTが保持するためにのみ十分です。これらの条件が満たされていなくても、CLTが保持される場合があります。したがって、分散を制限しない場合、単一の答えはなく、問題は完全にケース固有になると思います。ビリングスリーの本でさえこの問題についてははっきりしていない。問題は、残りがどのようになり、それについて何が言えるかです。
Alecos Papadopoulos 2014
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.