タグ付けされた質問 「lognormal」

対数正規分布は、対数が正規分布を持つ確率変数の分布です。

3
SVDを実行して欠損値を代入する方法、具体例
SVDを適用する前に欠損値を処理する方法に関する素晴らしいコメントを読みましたが、簡単な例でどのように機能するか知りたいです。 Movie1 Movie2 Movie3 User1 5 4 User2 2 5 5 User3 3 4 User4 1 5 User5 5 1 5 上記のマトリックスを考えると、NAの値を削除すると、User2とUser5しかなくなります。これは、私のUが2×kになることを意味します。しかし、欠損値を予測する場合、Uは5×kである必要があります。これは、特異値とVで乗算できます。 上記のマトリックスで、最初に欠損値のあるユーザーを削除してからSVDを適用して、欠損値を記入する人はいますか?数学記号を使いすぎずに、適用した手順の非常に簡単な説明を提供し、答えを実用的なものにしてください(つまり、数値に別の数値を掛けると答えが得られます)。 次のリンクを読みました。 stats.stackexchange.com/q/33142 stats.stackexchange.com/q/31096 stats.stackexchange.com/q/33103
8 r  missing-data  data-imputation  svd  sampling  matlab  mcmc  importance-sampling  predictive-models  prediction  algorithms  graphical-model  graph-theory  r  regression  regression-coefficients  r-squared  r  regression  modeling  confounding  residuals  fitting  glmm  zero-inflation  overdispersion  optimization  curve-fitting  regression  time-series  order-statistics  bayesian  prior  uninformative-prior  probability  discrete-data  kolmogorov-smirnov  r  data-visualization  histogram  dimensionality-reduction  classification  clustering  accuracy  semi-supervised  labeling  state-space-models  t-test  biostatistics  paired-comparisons  paired-data  bioinformatics  regression  logistic  multiple-regression  mixed-model  random-effects-model  neural-networks  error-propagation  numerical-integration  time-series  missing-data  data-imputation  probability  self-study  combinatorics  survival  cox-model  statistical-significance  wilcoxon-mann-whitney  hypothesis-testing  distributions  normal-distribution  variance  t-distribution  probability  simulation  random-walk  diffusion  hypothesis-testing  z-test  hypothesis-testing  data-transformation  lognormal  r  regression  agreement-statistics  classification  svm  mixed-model  non-independent  observational-study  goodness-of-fit  residuals  confirmatory-factor  neural-networks  deep-learning 

1
サンプルの平均値と中央値から対数正規分布のパラメーターを取得できますか?
対数正規分布から抽出されたサンプルの平均値と中央値があります。これは変数のログの平均値と中央値ではないことに注意してください。もちろん、平均値と中央値のログを計算できます。この情報からμとσの閉じた形の解はありますか?数値解しかない場合、理想的にはRを使用して、それを見つける方法を教えてください。 私はこの質問は、ここで、サンプル平均と標本分散からμとσを導出するために回答されていることに注意してください: 私はサンプル平均と標本分散から対数正規分布のパラメータを推定するにはどうすればよい しかし、私は持っていません。サンプル分散、平均と中央値のみ。 閉じた形式または単純な数値解がない場合、サンプルの平均と中央値のログ、またはそれらの何らかの変換を使用すると、大規模なサンプル(数億単位)に対して適切な回答が得られるかどうかを知りたいです。 )。

1
ここで、
私は期待を計算しようとしています任意のためのC &lt; 0(のためのC &gt; 0ならば期待が無限である)Xが対数正規分布している、すなわちログ(X )〜N (μ 、σ )。E[ ec X]E[ecX]E[e^{cX}]c &lt; 0c&lt;0c<0c &gt; 0c&gt;0c>0バツXXログ(X)〜N(μ 、σ)log⁡(X)∼N(μ,σ)\log(X) \sim N(\mu, \sigma) 私の考えは、期待値を積分として書くことでしたが、どうすればよいかわかりませんでした: E[ ec X] = 12つのσπ−−−√∫∞01バツexp( c x − (ログX - μ )22つのσ2) dバツE[ecX]=12σπ∫0∞1xexp⁡(cx−(log⁡x−μ)22σ2)dxE[e^{cX}] = \frac{1}{\sqrt{2\sigma\pi}}\int_0^\infty \frac{1}{x}\exp\left(cx - \frac{(\log x - \mu)^2}{2\sigma^2}\right)dx 私は伊藤の公式も試しました(実際のタスクはを見つけることです。ここでXは幾何学的なブラウン運動ですが、マルコフプロセスを見ているので、上記の問題に還元されます)。しかし、それもあまり有望に見えませんでした。誰かが私を助けてくれますか?E[ ec XT∣ Xt= x ]E[ecXT∣Xt=x]E[e^{cX_T} \mid X_t = …

1
対数正規分布の信頼区間からの標準偏差の計算
私は、ランダム効果のオッズ比(Woolfの方法を使用して計算)と、あるグループで発生したイベントの95%信頼区間を別のグループと比較して報告した10件の研究のメタ分析の結果があります。 O R = 7.1 (95 %C 私 4.4 − 11.7 )OR=7.1 (95% C私 4.4−11.7)OR = 7.1\ (95\%\ CI\ 4.4-11.7) 現在、この確率比をサンプリングする必要があるモデルを作成しています(確率的感度分析の目的で)。それがオッズ比であることを考えると、対数正規分布で7.1が平均であると想定していますが、ExcelのLOGNORMDIST関数を使用して分布をサンプリングできるように信頼区間を標準偏差に変換する最良の方法は何ですか? (私は(通常、ガンマ分布のために同様の質問を見つけた信頼区間から標準偏差に-私が行方不明ですか?そしてどのようにR与えられた信頼区間と正常またはガンマ分布で平均値と標準偏差を計算するには?)とも質問対数正規分布の信頼区間を計算します(対数正規データセットの平均の信頼区間を計算するにはどうすればよいですか)。しかし、逆の方法を見つけることができないようです。)

1
対数正規分布の中央値の推定量としてサンプル中央値をいつ使用するのですか?
私自身は常に幾何平均を使用して対数正規中央値を推定します。ただし、業界では、サンプルの中央値を使用するとより良い結果が得られる場合があります。したがって、問題は、サンプル中央値を母集団中央値の推定量として確実に使用できる開始カットオフ範囲/ポイントがあるかどうかです。 また、サンプルの幾何平均は中央値のMLEですが、偏りはありません。偏りのない推定量は、が既知の場合、ます。実際には、は常に不明であるため、バイアスされた修正推定量 (下記を参照)が使用されます。MSEが小さく偏りがないため、このバイアス補正されたgeomean推定量はより優れているとする論文があります。ただし、実際には、サンプルサイズが4〜6しかない場合、バイアス補正は意味がないと主張できます。σ β CGMσβ^CGM0= exp(μ^- σ2/ 2N)β^CGM0=exp⁡(μ^−σ2/2N)\hat{\beta}_{\mbox{CGM0}}=\exp(\hat{\mu}-\sigma^2/2N)σσ\sigmaβ^CGMβ^CGM\hat{\beta}_{\mbox{CGM}}σσ\sigma 偏りがないとは、推定器が真の母集団パラメーターを中心とし、パラメーターの下でも過大でもないことを意味します。正に歪んだ分布の場合、中心は平均ではなく中央値です。 変換に対する不変量は、現在の領域で重要なプロパティです(DT50と劣化率kの間の変換、k = log(2)/ DT50)。元のデータと変換されたデータに基づいて、異なる結果が得られます。 限られたサンプルサイズの場合、平均不偏性は誤解を招く可能性があります。バイアスはエラーではなく、不偏推定量はより大きなエラーを与える可能性があります。ベイジアンの観点からは、データは既知で固定されており、MLEはデータを観察する確率を最大化し、バイアス補正は固定パラメーターに基づいています。 サンプルの幾何平均推定量はMLEで、中央値に偏りがなく、変換に対して不変です。バイアス補正されたgeomean推定器よりも望ましいと思います。私は正しいですか? Assummingバツ1、X2、。。。、XN〜LN(μ 、σ2)X1,X2,...,XN∼LN(μ,σ2)X_1,X_2,...,X_N \sim \mbox{LN}(\mu,\sigma^2) β= exp(μ )β=exp⁡(μ)\beta = \exp(\mu) β^GM= exp(μ^)= exp(∑ ログ(X私)N)〜 LN(μ、 σ2/ N)β^GM=exp⁡(μ^)=exp⁡(∑log⁡(Xi)N)∼LN(μ,σ2/N)\hat{\beta}_{\mbox{GM}}= \exp(\hat{\mu})= \exp{(\sum\frac{\log(X_i)}{N})} \sim \mbox{LN}(\mu,\sigma^2/N) β^SM= 中央値(X1、X2、。。。、XN)β^SM=median(X1,X2,...,XN)\hat{\beta}_{\mbox{SM}}= \mbox{median}(X_1,X_2,...,X_N) β^CGM= exp(μ^- σ^2/ 2N)β^CGM=exp⁡(μ^−σ^2/2N)\hat{\beta}_{\mbox{CGM}}= \exp(\hat{\mu}-\hat\sigma^2/2N) ここで、とは対数平均とlog-sd、とはと MLEです。σ μ σ μ σμμ\muσσ\sigmaμ^μ^\hat\muσ^σ^\hat\sigmaμμ\muσσ\sigma 関連する質問:サンプル中央値の分散には、近似式ます。この式を使用するのに十分な大きさのサンプルサイズとは14Nf(m)214Nf(m)2\frac{1}{4Nf(m)^2}

1
MLE /対数正規分布区間の可能性
以下のサンプルのように、間隔として表される応答の変数セットがあります。 &gt; head(left) [1] 860 516 430 1118 860 602 &gt; head(right) [1] 946 602 516 1204 946 688 ここで、左は応答の下限、右は応答の上限です。対数正規分布に従ってパラメーターを推定したい。 しばらくの間、可能性を直接計算しようとしたとき、2つの境界が異なるパラメーターのセットに沿って分布しているため、以下のようないくつかの負の値が得られるという事実に苦労していました。 &gt; Pr_high=plnorm(wta_high,meanlog_high,sdlog_high) &gt; Pr_low=plnorm(wta_low, meanlog_low,sdlog_low) &gt; Pr=Pr_high-Pr_low &gt; &gt; head(Pr) [1] -0.0079951419 0.0001207749 0.0008002343 -0.0009705125 -0.0079951419 -0.0022395514 私は実際にそれを解決する方法を理解できず、代わりに間隔の中間点を使用することに決めました。これは、間隔応答の対数尤度を抽出するmledist関数を見つけるまで、良い妥協です。これは私が得る要約です: &gt; mledist(int, distr="lnorm") $estimate meanlog sdlog 6.9092257 0.3120138 $convergence [1] 0 …

1
対数正規和の近似pdf(R)
尤度関数の一部として使用するために対数正規和pdfの近似が必要なアプリケーションがあります。対数正規和の分布には閉じた形がなく、さまざまな近似についての信号処理ジャーナルに多数の論文があります。私は最も単純な近似(Fenton 1960)の1つを使用しています。これはコードを書くのはかなり簡単ですが、過去50年間に書かれた主題に関する文献から判断すると、これはすべてのアプリケーションにとって最適な近似とは限りません。どの近似が最良のMLE推定につながるかを特定する方法について、私は直感がありません。 (A)最尤アプリケーションに使用する必要がある別の近似があるかどうかは誰かが知っていますか?(B)より計算集約型の近似のための既存のRコードはありますか? 更新:問題の背景については、このレビューを参照してください
8 r  lognormal 

2
R:対数スケールでの箱ひげ図対対数変換*次に*箱ひげ図の作成:同じ結果が得られない
boxplot()R の関数にlog =は、軸を対数スケールにするかどうかを指定する引数があります。 私にとって、このオプションを選択した場合(log = "y"引数として指定)、箱ひげ図の形状は、最初にログで手動でデータを変換し、次にそのログ変換されたデータをプロットした場合と同じように見えるはずです(ラベルを認識します)軸上では異なりますが、プロットの形状を参照しています)。ただし、これは当てはまりません。 簡単な例を以下に示します。 set.seed(923489) data &lt;- rlnorm(300, meanlog = 0, sdlog = 1) boxplot(data) # Highly skewed right raw data boxplot(data, log="y") # Data on log scale; less right-skewed boxplot(log10(data)) # Log base 10-transform data; shape not the same as when specify log="y" boxplot(log(data)) # Natural …

1
対数正規確率変数の合計の分布を見つける
2つの対数正規確率変数の合計の分布を見つけようとしています。これを投稿する前に、クロス検証済み、スタックオーバーフロー、およびいくつかの論文で利用可能な文献を参照しました。 畳み込みを使用して、2つの対数正規rvの合計の分布を見つけました。近似は違いに対して機能します。しかし、合計ではありません。CDFとPDFの両方で0でひどいねじれが発生しています。その理由がわかりませんでした。微調整を少し行うだけで、分布の形が正しくなります。しかし、私がやっていたことが正しいかどうかはわかりません。 誰かが私をここに案内できますか?

1
2つの対数正規確率変数の積
ましょうと 2つの通常のランダムな変数です。書くと、修正のアイデアへ。X1X1X_1X2X2X_2X1∼N(μ1,σ21)X1∼N(μ1,σ12)X_1\sim N(\mu_1, \sigma^2_1)X2∼N(μ2,σ22)X2∼N(μ2,σ22)X_2\sim N(\mu_2, \sigma^2_2) 対応する対数正規確率変数を考慮してください:、。Z1=exp(X1)Z1=exp⁡(X1)Z_1 = \exp(X_1)Z2=exp(X2)Z2=exp⁡(X2)Z_2 = \exp(X_2) 質問:2つの確率変数の積の分布、つまりの分布はですか?Z1Z2Z1Z2Z_1Z_2 正規確率変数が独立しているか、2変量正規分布がある場合、答えは簡単ですであり、合計正規分布であるため、積はまだ対数正規です。バツ1、バツ2X1,X2X_1, X_2Z1Z2= exp(バツ1+バツ2)Z1Z2=exp⁡(X1+X2)Z_1Z_2 = \exp(X_1+X_2)バツ1+バツ2X1+X2X_1+X_2Z1Z2Z1Z2Z_1Z_2 ただし、は一般に独立してと仮定します(相関。の分布について何が言えますか?バツ1、バツ2X1,X2X_1, X_2N 、O 、Tnotnotρρ\rhoZ1Z2Z1Z2Z_1Z_2
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.