独立した対数正規確率変数の合計は対数正規に見えますか?


11

観測数を増やすと、2つ(以上)の対数正規確率変数の合計が対数正規分布に近づく理由を理解しようとしています。オンラインで調べたところ、これに関する結果は見つかりませんでした。

明らかに、とが独立した対数正規変数である場合、指数とガウス確率変数の特性により、も対数正規です。ただし、も対数正規であることを示唆する理由はありません。Y X × Y X + YバツYバツ×Yバツ+Y

しかしながら

2つの独立した対数正規確率変数およびYを生成し、Z = X + Yとし、このプロセスを何度も繰り返すと、Zの分布は対数正規に見えます。観測数を増やすと、対数正規分布に近づくように見えます。バツYZ=バツ+YZ

例:100万ペアを生成した後、Z自然対数の分布が以下のヒストグラムに示されます。これは非常に明らかに正規分布に似ており、が実際に対数正規であることを示唆しています。Z

ここに画像の説明を入力してください

誰かがこれを理解するのに役立つかもしれないテキストへの洞察または参照を持っていますか?


Yの分散が等しいと想定していますか?をシミュレートすると、合計の対数はあまり正常に見えなくなります。バツYxx <- rlnorm(1e6,0,3); yy <- rlnorm(1e6,0,1)
Stephan Kolassa 16年

分散が等しいと仮定しました-分散が等しくない別のものを試して、結果がどうなるかを確認します。
Patty

2と3の分散により、私はまだ少し正常に見えたものを手に入れました。
Patty

1
見て、以前の質問は役に立つかもしれません。ここここは潜在的に有用な論文です。よく見る!
Stephan Kolassa、2016年

回答:


20

対数正規の合計のこのおおよその対数正規性は、よく知られた経験則です。それは多数の論文で言及されている-そしてサイト上の多くの投稿で。

最初の2つのモーメントを一致させることによる対数正規の合計の対数正規近似は、Fenton-Wilkinson近似と呼ばれることがあります。

Dufresneによるこのドキュメントは役に立つかもしれません(ここ、またはここから入手できます)。

私は過去にも時々ミッチェルの論文を人々に指摘しました

ミッチェル、RL(1968)、
「対数正規分布の永続性」。
J。オプティカルソサエティオブアメリカ。58:1267-1272。

しかし、それは現在、Dufresneのリファレンスでカバーされています。

これは、1000個のシミュレートされた値のヒストグラムで、それぞれが5万個の iid対数正規の合計の対数です。

5万の対数正規分布の合計のヒストグラム

ご覧のとおり...ログはかなりゆがんでいるため、合計はlognormalにあまり近づきません。

*いくつあるかは調べていませんが、合計の歪度(平均値)の振る舞いが原因で、数百万は明らかに不十分です。


μ=0σ=4

res <- replicate(1000,sum(rlnorm(50000,0,4)))
hist(log(res),n=100)

=106


図のヒストグラムを作成するために使用されるパラメーター(またはコードスニペット)を追加できますか?
altroware

1
μμ=0σμ=0σ44
Glen_b-モニカを復活させる'09 / 09/22

1
res <- replicate(1000,sum(rlnorm(50000,0,4))); hist(log(res),n=100)26.5

2

手遅れかもしれませんが、トピックをカバーする対数正規分布の合計に関する次の論文を見つけまし。これは対数正規ではありませんが、かなり異なり、操作が困難です。


1

2009年のDufresneによってadviced紙と、このとともに2004年から1 本便利な論文は 対数正規分布の和の近似値に歴史をカバーし、合計数学的な結果を与えます。

μσ

たぶん[このペーパー](http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=6029348)は、特定のケースで、対数正規の合計に対するある種の中心極限定理を与えますが、まだ一般性の欠如。とにかく、Glen_bによって与えられた例は、古典的な中心極限定理を簡単に適用できる場合であり、もちろんその場合、対数正規の合計がガウスであるので、実際には適切ではありません。


1
私の例では、「古典的な中心極限定理を簡単に適用できます」と述べていますが、ヒストグラムが何を示しているかを理解している場合、CLTを使用して、通常の近似がこの場合n = 50000に適用されると主張することはできません。合計は非常に正しいスキューでありそのログは依然としてかなり右のスキューです。この例のポイントは、対数正規で近似するにはスキューが大きすぎることです(または、ヒストグラムは対称に非常に近く見えます)。スキューが少ない近似値(通常など)は*さらに悪い* /
Glen_b -Reinstate Monica

私は同意しますが、おそらくあなたの例では、サンプルの数値的収束に達していない(1000試行が少なすぎる)か、統計的収束に達していない(50 000加数が少なすぎる)が、無限大の場合、分布は私達はCLT状態にあるので、ガウシアンになりませんか?
ミミ

1000サンプルは、合計の分布の形状を識別するのに十分以上です-取得するサンプルの数は、形状を変更しません。明確な歪度は、より大きなサンプルを取得しても消えることはなく、見た目がよりスムーズになります。はい、50,000は合計が正常に見えるには少なすぎます。これは正しいスキューであるため、ログは依然として非常にスキューに見えます。それが合理的に正常に見える前に何百万も必要とするかもしれません。はい、CLTは確実に適用されます。それはiidであり、分散は有限であるため、標準化された手段は最終的に正規性に近づく必要があります。
Glen_b-モニカを復活させる

1

対数正規法則は物理現象に広く存在します。この種の変数分布の合計は、たとえばシステムのスケーリング動作を研究するために必要です。私はこの記事を知っています(非常に長くて非常に強力であり、具体的でない場合は最初に理解できます!)、「対数正規確率変数の合計における広範な分布効果」、2003年に発行(ヨーロッパ物理ジャーナルB凝縮物および複雑物)システム32、513)およびhttps://arxiv.org/pdf/physics/0211065.pdfから入手できます

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.