そのため、対数正規分布のランダム変数生成するランダムプロセスがあります。対応する確率密度関数は次のとおりです。
元の分布のいくつかのモーメントの分布を推定したいと考えました。1番目のモーメント、つまり算術平均です。そのために、算術平均の10000の推定値を計算できるように、100個のランダム変数を10000回描画しました。
その平均を見積もるには、2つの異なる方法があります(少なくとも、それは私が理解したことです:私は間違っているかもしれません)。
- はっきり平均算術通常の方法を計算することによって:
- または、基礎となる正規分布から最初におよびμを推定することによって:μ = N ∑ i = 1 log (X i)、次に平均として ˉ X =EXP(μ+1
問題は、これらの各推定値に対応する分布が体系的に異なることです。
「プレーン」平均(赤い破線で表される)は、指数形式(緑のプレーン線)から得られる値よりも一般に低い値を提供します。両方の平均はまったく同じデータセットで計算されますが。この違いは体系的であることに注意してください。
なぜこれらの分布は等しくないのですか?
とσの真のパラメーターは何ですか?
—
クリストフハンク
および σ = 1.5ですが、これらのパラメーターの推定に興味があることに注意してください。したがって、これらの生の数値から計算するのではなく、モンテカルロアプローチです。
—
-JohnW
確かに、これは結果を複製するためのものです。
—
クリストフハンク
興味深いことに、この現象は対数正規性とは関係ありません。対数y iの正の数値が与えられた場合、算術平均(AM)∑ x i / nは幾何平均(GM)exp (∑ y i / n )を下回らないことがよく知られています。もう一方の方向では、AMがGMにexp (s 2 y / 2。したがって、点線の赤い曲線は用緑色の曲線の左側に位置しなければならない任意の(正の乱数を記述する)親分布。
—
whuber
平均の多くが膨大な数の小さな確率に由来する場合、有限サンプル算術平均は、高い確率で母平均を過小評価する可能性があります。(予想では公平だが、小さな過小評価と大きなオーバー見積もりの小さな確率の大きな可能性があります。)この質問も、このいずれかに関連することができる:stats.stackexchange.com/questions/214733/...
—
マシュー・ガン