タグ付けされた質問 「lognormal」

対数正規分布は、対数が正規分布を持つ確率変数の分布です。

1
なぜln [E(x)]> E [ln(x)]ですか?
私たちは金融コースで対数正規分布を扱っており、私の教科書はこれが真実であると述べているだけで、数学の背景があまり強くないのでイライラすることがわかりますが、直感が欲しいです。なぜこれが事実なのか誰にでも教えてもらえますか?

1
対数正規分布の算術平均が分布平均よりも小さいのはなぜですか?
そのため、対数正規分布のランダム変数生成するランダムプロセスがありますXXX。対応する確率密度関数は次のとおりです。 元の分布のいくつかのモーメントの分布を推定したいと考えました。1番目のモーメント、つまり算術平均です。そのために、算術平均の10000の推定値を計算できるように、100個のランダム変数を10000回描画しました。 その平均を見積もるには、2つの異なる方法があります(少なくとも、それは私が理解したことです:私は間違っているかもしれません)。 はっきり平均算術通常の方法を計算することによって: X¯=∑i=1NXiN.X¯=∑i=1NXiN.\bar{X} = \sum_{i=1}^N \frac{X_i}{N}. または、基礎となる正規分布から最初におよびμを推定することによって:μ = N ∑ i = 1 log (X i)σσ\sigmaμμ\mu、次に平均として ˉ X =EXP(μ+1μ=∑i=1Nlog(Xi)Nσ2=∑i=1N(log(Xi)−μ)2Nμ=∑i=1Nlog⁡(Xi)Nσ2=∑i=1N(log⁡(Xi)−μ)2N\mu = \sum_{i=1}^N \frac{\log (X_i)}{N} \quad \sigma^2 = \sum_{i=1}^N \frac{\left(\log (X_i) - \mu\right)^2}{N}X¯=exp(μ+12σ2).X¯=exp⁡(μ+12σ2).\bar{X} = \exp(\mu + \frac{1}{2}\sigma^2). 問題は、これらの各推定値に対応する分布が体系的に異なることです。 「プレーン」平均(赤い破線で表される)は、指数形式(緑のプレーン線)から得られる値よりも一般に低い値を提供します。両方の平均はまったく同じデータセットで計算されますが。この違いは体系的であることに注意してください。 なぜこれらの分布は等しくないのですか?

3
データが正規分布と対数正規分布のサンプルである相対尤度を計算するアルゴリズムが必要
値のセットがあり、ガウス(正規)分布からサンプリングされたか、対数正規分布からサンプリングされた可能性が高いかどうかを知りたいとしましょう。 もちろん、理想的には、母集団または実験誤差の原因について何かを知っているので、質問に答えるのに役立つ追加情報があります。しかし、ここでは、数字のセットのみがあり、他の情報はないと仮定します。ガウス分布からのサンプリングと対数正規分布からのサンプリングのどちらがより可能性が高いでしょうか?どれくらい可能性がありますか?私が望んでいるのは、2つのモデルから選択するアルゴリズムで、できればそれぞれの相対的な可能性を定量化することです。

5
非常に多数のデータポイントで値の代入を実行する方法は?
非常に大きなデータセットがあり、約5%のランダムな値が欠落しています。これらの変数は互いに相関しています。次のRデータセットの例は、ダミーの相関データを使用した単なるおもちゃの例です。 set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", 1:10000, sep ="") rownames(xmat) <- paste("sample", 1:200, sep = "") #M variables are correlated N <- 2000000*0.05 # 5% random missing values inds <- round ( runif(N, 1, length(xmat)) …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

4
独立した対数正規確率変数の合計は対数正規に見えますか?
観測数を増やすと、2つ(以上)の対数正規確率変数の合計が対数正規分布に近づく理由を理解しようとしています。オンラインで調べたところ、これに関する結果は見つかりませんでした。 明らかに、とが独立した対数正規変数である場合、指数とガウス確率変数の特性により、も対数正規です。ただし、も対数正規であることを示唆する理由はありません。Y X × Y X + YバツバツXYYYバツ× Yバツ×YX \times Yバツ+ Yバツ+YX+Y しかしながら 2つの独立した対数正規確率変数およびYを生成し、Z = X + Yとし、このプロセスを何度も繰り返すと、Zの分布は対数正規に見えます。観測数を増やすと、対数正規分布に近づくように見えます。バツバツXYYYZ= X+ YZ=バツ+YZ=X+YZZZ 例:100万ペアを生成した後、Zの自然対数の分布が以下のヒストグラムに示されます。これは非常に明らかに正規分布に似ており、が実際に対数正規であることを示唆しています。ZZZ 誰かがこれを理解するのに役立つかもしれないテキストへの洞察または参照を持っていますか?

1
近似
私は何気なく、次のような記事(経済学)を読んでいました。ログ(E(X))log⁡(E(X))\log(E(X)) 、ログ(E(X))≈ E(ログ(X))+ 0.5 v a r(ログ(X))log⁡(E(X))≈E(log⁡(X))+0.5var(log⁡(X))\log(E(X)) \approx E(\log(X))+0.5 \mathrm{var}(\log(X)) Xが対数正規であれば(筆者は知っています)、著者が言っていることは正確です。 私が知らないのは、この近似をどのように導出するかです。2次のテイラー近似を計算してみましたが、思いついたのは次の式だけです。 ログ(E(X))≈ E(ログ(X))+ 0.5 v a r(X)E(X)2log⁡(E(X))≈E(log⁡(X))+0.5var(X)E(X)2\log(E(X)) \approx E(\log(X))+0.5\frac{\mathrm{var}(X)}{E(X)^2}

1
2パーセンタイルを使用して対数正規分布の平均と標準偏差を計算する方法
対数正規分布の2パーセンタイルから平均と標準偏差を計算しようとしています。 私はX = mean + sd * Z、平均とsd を使用して解決する正規分布の計算を実行することに成功しました。 対数正規分布に対して同じことを行おうとすると、方程式が足りないと思います。私はウィキペディアを見て使用しようとしましたln(X) = mean + sd * Zが、この場合の平均とsdが正規分布のものか対数正規のものか混乱しています。 どの方程式を使用する必要がありますか?計算を解決するには2パーセンタイル以上必要ですか?
11 r  lognormal 

1
このサンプルの(対数)正規性を仮定できますか?
これが私のサンプルのQQプロットです(対数Y軸に注意してください)。:n = 1000n=1000n = 1000 whuberによって指摘されたように、これは、基になる分布が左に歪んでいる(右裾が短い)ことを示しています。 用いたshapiro.test(対数変換データ)Rで、Iは、検定統計量取得及びp値我々は正式ことを意味する、リジェクトヌル仮説 95%の信頼水準で。5.172 ⋅ 10 - 13 H 0:サンプルは正常に分布されていますW= 0.9718W=0.9718W = 0.97185.172 ⋅ 10− 135.172⋅10−135.172\cdot10^{-13}H0:サンプルは正規分布ですH0:the sample is normal distributedH_0 : \text{the sample is normal distributed} 私の質問は次のとおりです。これは、(対数)正規性を前提としたさらなる分析のために実際には十分ですか?特に、CoxとLandによる近似法を使用して、類似したサンプルの平均の信頼区間を計算したいと思います(論文で説明されている:Zou、GY、cindy Yan HuoおよびTaleban、J。(2009)。単純な信頼区間対数正規平均と、環境アプリケーションとの違い。Environmetrics20、172–180): ci <- function (x) { y <- log(x) n <- length(y) s2 <- var(y) m <- mean(y) …

3
データがログの正規分布に適合するかどうかを確認するにはどうすればよいですか?
Rデータが対数正規分布またはパレート分布に適合しているかどうかを確認したい。どうすればできますか?おそらくks.test私はそれを行うのに役立つでしょうが、私のデータのパレート分布のおよびパラメータをどのように取得できますか?αα\alphakkk

4
回帰でlog(0)項を回避する方法
以下の単純なXおよびYベクトルがあります。 > X [1] 1.000 0.063 0.031 0.012 0.005 0.000 > Y [1] 1.000 1.000 1.000 0.961 0.884 0.000 > > plot(X,Y) Xのlogを使用して回帰を実行したいと思います。log(0)を取得しないようにするために、+ 1または+0.1または+0.00001または+0.000000000000001を指定します。 > summary(lm(Y~log(X))) Error in lm.fit(x, y, offset = offset, singular.ok = singular.ok, ...) : NA/NaN/Inf in 'x' > summary(lm(Y~log(1+X))) Call: lm(formula = Y ~ log(1 + …

1
に対数正規確率密度関数を乗算して分析的に積分することは可能ですか?
まず、分析的に統合することによって、つまり、数値解析(台形、ガウスレジェンドル、シンプソンの規則など)とは対照的に、これを解決するための統合規則はありますか? 私には関数があり、 は、対数正規分布の確率密度関数です。パラメータおよび。以下では、表記を省略して、累積分布関数にを使用します。f(x)=xg(x;μ,σ)f(x)=xg(x;μ,σ)\newcommand{\rd}{\mathrm{d}}f(x) = x g(x; \mu, \sigma)g(x;μ,σ)=1σx2π−−√e−12σ2(log(x)−μ)2g(x;μ,σ)=1σx2πe−12σ2(log⁡(x)−μ)2 g(x; \mu, \sigma) = \frac{1}{\sigma x \sqrt{2\pi}} e^{-\frac{1}{2\sigma^2}(\log(x) - \mu)^2} μμ\muσσ\sigmag(x)g(x)g(x)G(x)G(x)G(x) 積分を計算する必要があり ∫baf(x)dx.∫abf(x)dx. \int_{a}^{b} f(x) \,\rd x \>. 現在、Gauss-Legendre法を使用した数値積分でこれを行っています。これを何度も実行する必要があるため、パフォーマンスは重要です。数値解析/その他の部分の最適化を検討する前に、これを解決するための統合ルールがあるかどうかを知りたいと思います。 パーツごとの統合ルールを適用してみたところ、再び行き詰まりました。 ∫udv=uv−∫vdu∫udv=uv−∫vdu\int u \,\mathrm{d}v = u v - \int v \mathrm{d}u。 u=x⟹du=dxu=x⟹du=dxu=x \implies \rd u = \rd x dv=g(x)dx⟹v=G(x)dv=g(x)dx⟹v=G(x)\rd v = g(x) \rd …

1
経験的測定値の「正規分布を仮定した」と書いてもよいですか。
人口などの生物医学的量の測定が通常の「ベルカーブ」に従うことは、医学などの応用分野の教育に根付いています。文字列のA Google検索「我々は正規分布と仮定」リターンをの結果を!気候変動に関する研究では、「極端なデータポイントの数が少ない場合は、温度異常の正規分布を想定した」ように聞こえます。または、ペンギンに関する異論の少ない可能性のある文書で「ニワトリの孵化日の正規分布を仮定した」。または 「GDP成長ショックの正規分布を想定」、23,90023,900\small 23,900、 ... と他のこと)。 最近、私はカウントデータの厳密に肯定的な性質のために正規分布としての扱いに疑問を感じました。もちろん、カウントデータは離散的であるため、正規性はさらに人為的になります。しかし、この後者の点を別にしても、原型的に「連続的」と見なされる、グルコースの重量、高さ、または濃度などの連続的な経験的測定が正常と見なされるのはなぜですか?カウントがする以上に否定的な実現観察はあり得ません! 標準偏差が平均より大幅に低く、負の値がほとんどない場合( "95%範囲チェック")、それは実際的な仮定である可能性があり、頻度ヒストグラムが歪んでいない場合はそれをサポートします。しかし、質問は些細なことのように思われませんでした、そして迅速な検索は興味深いものを見つけました。 で自然我々は、上の次のステートメントを見つけることができDFヒースによって手紙を:「私は特定のタイプのデータの統計的分析のためのデータを正規母集団から引き出されていることを仮定は通常間違っている、との代替ということを指摘したいです対数正規分布の仮定の方が優れています。この代替手段は統計学者、経済学者、物理学者に広く使用されていますが、他の分野の科学者には何らかの理由で無視されることがよくあります。」 Limpertは、「対数正規モデルは、現在多くの科学者が正規を有効な近似として認識しているという意味での近似として機能する可能性がある」と述べ、正規性の適合度テストの低い検出力と選択の難しさを指摘しています。小さなサンプルを扱う場合、経験的に正しい分布。 したがって、問題は「応用科学の実証的測定値の正規分布をさらに裏付けとなる証拠なしに仮定することはいつ受け入れられるのか」ということです。そして、なぜ対数正規のような他の代替案が、なぜ、そしておそらくおそらく定着しないのでしょうか?

2
誰かが私に対数正規分布のパラメーターを説明できますか?
私はいくつかの読書をしていますが、これはDeGrootの本から得た定義です。 それはパラメータが同じであることを意味しますか?たとえば、Xが対数正規分布で、Yが正規分布であると仮定します。ここで、Y = log(X)です。これは、XとYの形状分布が異なっていても、平均とSDは同じであるということですか?そうでない場合、μとσはどの分布を指しますか? つまり、Xが平均μとSDσで対数正規分布していると誰かが言った場合、平均とSDが正規項になるように変換する必要がありますか?

1
極値理論:対数正規GEVパラメーター
対数正規分布は、Gumbelの最大引力領域に属します。ここで、 FlogN(x;μ,σ)=Φ(lnx−μσ)FlogN(x;μ,σ)=Φ(ln⁡x−μσ)F^{logN}(x; \mu,\sigma)=\Phi\left(\frac{\ln x - \mu}{\sigma}\right)、 FGum(x;μ,β)=e−exp(−x−μβ)FGum(x;μ,β)=e−exp⁡(−x−μβ)F^{Gum}(x;\mu,\beta) = e^{-\exp\left({-\frac{x-\mu}{\beta}}\right)} 私の質問:μ=μμ=μ\mu=\muとσ=βσ=β\sigma=\betaますか? 極値分布はまた、表記使用β=σβ=σ\beta=\sigma(ガンベルが制限ケースでξ=0ξ=0\xi =0)、および標準対数正規と標準ガンベルためのCDFを比較すると、再びパラメータが一致する意味するものであろう。しかし、Gumbelは対数正規マキシマの限定的なケースであるため、私はそれについて確信がありません。そのため、パラメーターの変換も行われる可能性があります。

1
に対数正規分布がある場合、も対数正規分布がありますか?
さんが言ってみましょう対数正規分布を持っており、1つの実正の数があり。も対数正規分布があると言うのは正しいことですか?は負の値をとる可能性があるので、それは不可能だと思います。対数正規分布は正のドメインでのみ定義されます。誰かがそれを否定できますか?XXXccc(X−c)(X−c)(X -c)(X−c)(X−c)(X - c)
9 lognormal 

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.