タグ付けされた質問 「estimation」

このタグは一般的です。より具体的なタグを提供してください。特定の推定量のプロパティに関する質問については、代わりに[estimators]タグを使用してください。

2
中心打ち切り正規サンプルの分散の推定
分散を推定するために使用したい小さなサンプル(nは通常10から30)を取得する正規分散プロセスがあります。しかし、サンプルが非常に接近しているため、中心付近の個々のポイントを測定できないことがよくあります。 順序付けられたサンプルを使用して効率的な推定量を構築できるはずであるという漠然とした理解があります。たとえば、サンプルに20のポイントが含まれ、10が中心付近に密集しすぎて個別に測定できない場合、個別の測定があります。 5どちらかの側に、そのようなサンプルを最適に使用するプロセス分散を推定するための標準/公式のアプローチはありますか? (中心の平均に重みを付けることはできないと思います。たとえば、7つのサンプルが密にクラスター化する一方で、別の3つが非対称に片側に歪んでいる可能性がありますが、十分に近いので、面倒な単一のサンプリングなしではそのことがわかりません。 。) 答えが複雑な場合は、私が何を研究すべきかについてのヒントをいただければ幸いです。たとえば、これは注文統計の問題ですか?公式な答えがある可能性はありますか、またはこれは計算上の問題ですか? 更新された詳細:アプリケーションは射撃ターゲットの分析です。単一の基礎となるサンプルは、ターゲットへの単一ショットの影響点(x、y)です。基になるプロセスには対称的な2変量正規分布がありますが、軸間に相関関係がないため、{ x }と{ y }のサンプルを同じ正規分布から独立した描画として扱うことができます。(小規模のためにこれ、我々はまた、基本的なプロセスがレイリー分布していると言うことができるが、我々は、プロセスの「真の」中心の座標を特定することはできませんので、我々は、レイリー変量サンプルを測定することはできませんnは大幅にすることができサンプルの中心から離れている(、))ˉ Yバツ¯x¯\bar{x}y¯y¯\bar{y} ターゲットとそれに発砲されたショットの数が与えられます。問題は、n >> 3の場合、正確な銃は通常、異なるショットに囲まれた「不規則な穴」を撃つことです。穴のx-とy-の幅を観察できますが、穴のどこに明確でないショットが影響したかはわかりません。 次に、より問題の多いターゲットの例をいくつか示します。 (確かに、理想的な世界では、ショットごとにターゲットを変更/切り替えてから、サンプルを分析のために集約します。多くの場合、非現実的ですが、可能な場合に行われます)。 コメントでのWHuberの説明に続く次の注意事項:ショットは、均一で既知の直径のターゲット穴を生成します。ショットが「不規則なグループ」の外にある場合、発射体の半径がわかっているため、正確な中心測定できます。各「不揃いのグループ」では、いくつかの周辺の「ボール」を識別し、既知の発射体の半径に基づいて、これらの外側のショットの正確な中心をマークすることができます。これは、「不規則なグループ」の内部のどこかでのみ影響を受けていることがわかっている残りの「中央検閲」ショットです(通常、ターゲットごとに1つです)。バツ私xix_i 解決を容易にするために、これを法線から1次元のサンプルのセットに減らすことが最も簡単であると考えます。幅がw > dの中心間隔で、dは発射体の直径で、c < nの「打ち切られた」サンプルを含みます。

1
最大事後推定の例
私は最尤推定と最大事後推定について読んでいますが、これまでは、最尤推定でのみ具体的な例に出会いました。私は最大の事後推定のいくつかの抽象的な例を見つけましたが、それに数値を付けた具体的なものはまだありません:S それは非常に圧倒的で、抽象的な変数と関数でのみ機能し、この抽象性に溺れないようにするために、物事を時々現実の世界に関連付けるのは素晴らしいことです。しかし、もちろん、これは私の(そして他の人々の)観察にすぎません:) したがって、数字が記載された最大の事後推定の簡単で具体的な例を誰かに教えてもらえますか?それはとても役に立ちます:) ありがとうございました! 私は最初にこの質問をMSEに投稿しましたが、そこで回答を得ることができませんでした: /math/449386/example-of-maximum-a-posteriori-estimation 私はここにクロスポストで与えられた指示に従いました: http://meta.math.stackexchange.com/questions/5028/how-do-i-move-a-post-to-another-forum-like-cv-stats

1
ロジスティック回帰の上限を5から7データポイントだけで推定する方法は?
という形式のデータがあります。からの推定には、このペーパーの式を使用します非線形回帰と非線形最小二乗 このペーパーでは、データを調べることによってを推定します。そうすれば、3ポイントしかない場合でも問題なく機能します。それから、他の2つを計算できます。Rではnls()を、C#ではLevenbergMarquardtを使用してパラメーターをテストしました。彼らによって返されたモデルは満足です。 β1β3β1y=β11+exp(β2+β3∗x)y=β11+exp⁡(β2+β3∗x)y = \frac{\beta_1}{1 + \exp(\beta_2 + \beta_3 * x)}β1β1\beta_1β3β3\beta_3β1β1\beta_1 問題は、データを調べてな推定量を取得したくないことです。プログラムで計算してください。しばらくの間、最大値より少し高い値(から\ max * 1.5の間の値)を使用しました。これは、ポイントがほとんどの関数をカバーしている限り、問題なく機能しました。データポイントは曲線の「上」からどこかにありますが、すべてが変曲点の「下」の領域からのものである場合、この推定量は予想よりも低く、モデルに適合できませんでした。これは、(途方もなく高い値で乗算することにより)最大ポイントよりも明らかに高いため、モデルは便利な方法で適合しません。β1β1\beta_1max∗1.1max∗1.1\max * 1.1max∗1.5max∗1.5\max * 1.5 測定値は次のようになります。 x =(40、50、60、70)、y =(1000、950、400、200)->推定が容易 x =(40、50、60、70)、y =(1000、950、800、100)->推定が容易 x =(40、50、60、70)、y =(500、200、100、50)->簡単に推定できない 与えられたポイントのデルタを計算し、それに応じて上限を計算することで、関数のどこにいるのか(「ボトム」、「トップ」、スロープ)を見つけることができると思います。誰かがより良い解決策のヒントを持っていますか?追加情報:それができない場合は、適合できる測定値が可能な限り良いことは私にとってより重要であり、一部の測定値はまったく適合できないことを受け入れます。 (C#での実装が必要ですが、ここに投稿しましたが、問題は言語に依存しているとは思いません) 更新(これのアプリケーション): xは温度値であり、yは対応する測定値です。本来、低温ではy値が高く、その逆のロジスティック曲線のように見えるはずです。融点は曲線の変曲点に等しく、モデルパラメータの小さな変化で大きく変化します。 更新(7つのデータポイントと60で既知の変曲点で構成されたデータ): //first I made up some data without any noise and enough (13) points double[] x17 = …

2
以下のための基準
前の質問に対する彼の回答では、@ Erik P.は式 ここでは分布の過剰な尖度です。サンプル分散の分布に関するWikipediaのエントリへの参照が示されていますが、Wikipediaのページには「引用が必要」と記載されています。κV a r [ s2] = σ4(2n − 1+ κん)、Var[s2]=σ4(2n−1+κn), \mathrm{Var}[s^2]=\sigma^4 \left(\frac{2}{n-1} + \frac{\kappa}{n}\right) \>, κκ\kappa 私の主な質問は、この式のリファレンスはありますか?導出することは「取るに足らない」ことであり、そうであれば、それは教科書で見つけることができますか?(@Erik P.は、数学統計とデータ分析でも、CasellaとBergerによる統計推論でもそれを見つけることができませんでした。トピックはカバーされていますが。 教科書への参照があればいいのですが、()の主要な参照があるとさらに便利です。 (関連する質問は:未知の分布からのサンプルの分散の分布は何ですか?) 更新:@cardinalがmath.SEの別の方程式を指摘しました: ここで、は4番目の中心モーメントです。 μ4V a r( S2) = μ4ん− σ4(n −3 )ん(n − 1 )Var(S2)=μ4n−σ4(n−3)n(n−1) \mathrm{Var}(S^2)={\mu_4\over n}-{\sigma^4\,(n-3)\over n\,(n-1)} μ4μ4\mu_4 方程式を並べ替えて2つを解決する方法はありますか、それともタイトルの方程式が間違っていますか?

3
スパイクなしの打ち切られたガウス曲線の平均とst devの推定
平均mと標準偏差sの正規分布に従ってデータを生成するブラックボックスがあるとします。ただし、それが0未満の値を出力する場合は常に何も記録しないと仮定します(そのような値が出力されたとさえ言えません)。スパイクのない打ち切りガウス分布があります。 これらのパラメータをどのように推定できますか?

1
R / mgcv:なぜte()とti()テンソル積が異なる表面を生成するのですか?
のmgcvパッケージにRは、テンソル積の相互作用をフィッティングするための2つの関数がte()ありti()ます。私は2つの作業の基本的な分業を理解しています(非線形の相互作用を当てはめるか、この相互作用を主効果と相互作用に分解するか)。私が理解していないのは、なぜte(x1, x2)、そしてti(x1) + ti(x2) + ti(x1, x2)(わずかに)異なる結果を生成するのかということです。 MWE(から適応?ti): require(mgcv) test1 <- function(x,z,sx=0.3,sz=0.4) { x <- x*20 (pi**sx*sz)*(1.2*exp(-(x-0.2)^2/sx^2-(z-0.3)^2/sz^2)+ 0.8*exp(-(x-0.7)^2/sx^2-(z-0.8)^2/sz^2)) } n <- 500 x <- runif(n)/20;z <- runif(n); xs <- seq(0,1,length=30)/20;zs <- seq(0,1,length=30) pr <- data.frame(x=rep(xs,30),z=rep(zs,rep(30,30))) truth <- matrix(test1(pr$x,pr$z),30,30) f <- test1(x,z) y <- f + rnorm(n)*0.2 par(mfrow = c(2,2)) # …
11 r  gam  mgcv  conditional-probability  mixed-model  references  bayesian  estimation  conditional-probability  machine-learning  optimization  gradient-descent  r  hypothesis-testing  wilcoxon-mann-whitney  time-series  bayesian  inference  change-point  time-series  anova  repeated-measures  statistical-significance  bayesian  contingency-tables  regression  prediction  quantiles  classification  auc  k-means  scikit-learn  regression  spatial  circular-statistics  t-test  effect-size  cohens-d  r  cross-validation  feature-selection  caret  machine-learning  modeling  python  optimization  frequentist  correlation  sample-size  normalization  group-differences  heteroscedasticity  independence  generalized-least-squares  lme4-nlme  references  mcmc  metropolis-hastings  optimization  r  logistic  feature-selection  separation  clustering  k-means  normal-distribution  gaussian-mixture  kullback-leibler  java  spark-mllib  data-visualization  categorical-data  barplot  hypothesis-testing  statistical-significance  chi-squared  type-i-and-ii-errors  pca  scikit-learn  conditional-expectation  statistical-significance  meta-analysis  intuition  r  time-series  multivariate-analysis  garch  machine-learning  classification  data-mining  missing-data  cart  regression  cross-validation  matrix-decomposition  categorical-data  repeated-measures  chi-squared  assumptions  contingency-tables  prediction  binary-data  trend  test-for-trend  matrix-inverse  anova  categorical-data  regression-coefficients  standard-error  r  distributions  exponential  interarrival-time  copula  log-likelihood  time-series  forecasting  prediction-interval  mean  standard-error  meta-analysis  meta-regression  network-meta-analysis  systematic-review  normal-distribution  multiple-regression  generalized-linear-model  poisson-distribution  poisson-regression  r  sas  cohens-kappa 



1
不等分散のJames-Stein Estimator
James-Stein推定量について私が見つけたすべてのステートメントは、推定されている確率変数が同じ(および単位)分散を持っていると想定しています。 しかし、これらの例はすべて、JS推定器を使用して、互いに何の関係もなく数量を推定できることにも言及しています。ウィキペディアの例は、モンタナの光、台湾のお茶の消費量、および豚の体重の速度です。しかし、おそらくこれらの3つの量の測定値には、異なる「真の」分散があります。これは問題を引き起こしますか? :この質問に関連し、私は理解していないという大きな概念問題にこのネクタイ、ジェームズ・スタイン推定:どのようエフロンとモリス計算でした彼らの野球例えば収縮率で?σ2σ2\sigma^2収縮率は次のように計算します。ccc c=1−(k−3)σ2∑(y−y¯)2c=1−(k−3)σ2∑(y−y¯)2 c = 1 - \frac{(k-3) \sigma^2} {\sum (y - \bar{y})^2} 直感的に、私は、と思うだろう項は、実際にあるσ 2 Iと推定されている各数量ごとに異なります- 。しかし、その質問の議論はプールされた分散の使用についてのみ話します...σ2σ2\sigma^2σ2iσi2\sigma^2_i 誰かこの混乱を解消していただければ幸いです。

1
シグモイド曲線の直線部分の勾配の推定
私はこの仕事を与えられて困惑しました。同僚から、次のグラフのとx l o w e rを推定するように依頼されました。xupperxupperx_{upper}xlowerxlowerx_{lower} 曲線は実際には累積分布であり、xはある種の測定値です。彼は、累積関数が直線になり始め、直線から逸脱したときのxの対応する値を知りたいと思っています。 微分を使用してポイントの勾配を見つけることができることは理解していますが、直線をいつ呼び出すことができるかを判断する方法がわかりません。いくつかの既存のアプローチ/文学への少しのナッジは非常に高く評価されます。 この種の調査で関連するパッケージや例を知っていたら、Rも知っています。 どうもありがとう。 更新 Floundererのおかげで、作業をさらに拡張し、フレームワークを設定し、あちこちでパラメーターをいじくり回すことができました。学習目的のために、ここに私の現在のコードとグラフィック出力があります。 library(ESPRESSO) x <- skew.rnorm(800, 150, 5, 3) x <- sort(x) meanX <- mean(x) sdX <- sd(x) stdX <- (x-meanX)/sdX y <- pnorm(stdX) par(mfrow=c(2,2), mai=c(1,1,0.3,0.3)) hist(x, col="#03718750", border="white", main="") nq <- diff(y)/diff(x) plot.ts(nq, col="#6dc03480") log.nq <- log(nq) low <- …

2
積分の精度を推定する方法は?
コンピュータグラフィックスで非常に一般的な状況は、一部のピクセルの色が一部の実数値関数の積分に等しいことです。多くの場合、関数は複雑すぎて分析的に解くことができないため、数値近似を行います。しかし、この関数は計算に非常にコストがかかることも多いため、計算できるサンプルの数には大きな制約があります。(たとえば、100万サンプルを取得して、そのままにしておくことはできません。) 次に、一般的に、推定積分が「十分に正確」になるまで、ランダムに選択されたポイントで関数を評価します。これは私の実際の質問に私をもたらします:積分の「精度」をどのように推定しますか? 具体的には、があります。これは、いくつかの複雑で低速なコンピューターアルゴリズムによって実装されます。見積もりたいf:R→Rf:R→Rf : \mathbb{R} \rightarrow \mathbb{R} k=∫baf(x) dxk=∫abf(x) dxk = \int_a^b f(x) \ dx 任意のxに対してを計算できますが、コストがかかります。したがって、ランダムにいくつかのx値を選択し、kの推定が許容できるほど正確になったときに停止します。もちろん、これを行うには、現在の見積もりが実際にどれほど正確であるかを知る必要があります。f(x)f(x)f(x)xxxxxxkkk この種の問題にどの統計ツールが適切であるかさえわかりません。しかし、私がfについてまったく何も知らなければ、問題は解決できないようです。たとえば、f (x )を1000回計算し、それが常にゼロの場合、推定積分はゼロになります。しかし、については何も知りませんfは、それがあることはまだ可能だF (xは)= 1 、000 、000をお使いの推定値は恐ろしく間違っているので、あなたは、サンプルに起こった点を除いてどこでも!ffff(x)f(x)f(x)ffff(x)=1,000,000f(x)=1,000,000f(x) = 1,000,000 ffffff 編集: OK、これは多くの応答を生成したようで、これは良いことです。それぞれに個別に返信するのではなく、ここで追加の背景を記入してみます。 ffffffffffff fffffffff fff また、「モンテカルロ」が出現した回数を考えると、それがこの種の統合の専門用語だと思いますか?


1
UMVUEの存在との推定量の選択にで人口
してみましょうから引き出されたランダムサンプルで人口。(X1,X2,⋯,Xn)(X1,X2,⋯,Xn)(X_1,X_2,\cdots,X_n)N(θ,θ2)N(θ,θ2)\mathcal N(\theta,\theta^2)θ∈Rθ∈R\theta\in\mathbb R のUMVUEを探しています。θθ\theta 結合密度は(X1,X2,⋯,Xn)(X1,X2,⋯,Xn)(X_1,X_2,\cdots,X_n) fθ(x1、x2、⋯ 、xん)= ∏i = 1ん1θ 2 π−−√exp[ − 12つのθ2(x私− θ )2]=1(θ2 π−−√)んexp[ −12θ2Σi = 1ん(x私- θ)2]=1(θ 2 π−−√)んexp[ 1θΣi = 1んバツ私− 12つのθ2Σi = 1んバツ2私− n2]= g(θ 、T(x))h (x)∀(x1、⋯ 、xん)∈ Rん、∀θ ∈ Rfθ(x1,x2,⋯,xn)=∏i=1n1θ2πexp⁡[−12θ2(xi−θ)2]=1(θ2π)nexp⁡[−12θ2∑i=1n(xi−θ)2]=1(θ2π)nexp⁡[1θ∑i=1nxi−12θ2∑i=1nxi2−n2]=g(θ,T(x))h(x)∀(x1,⋯,xn)∈Rn,∀θ∈R\begin{align} f_{\theta}(x_1,x_2,\cdots,x_n)&=\prod_{i=1}^n\frac{1}{\theta\sqrt{2\pi}}\exp\left[-\frac{1}{2\theta^2}(x_i-\theta)^2\right] \\&=\frac{1}{(\theta\sqrt{2\pi})^n}\exp\left[-\frac{1}{2\theta^2}\sum_{i=1}^n(x_i-\theta)^2\right] \\&=\frac{1}{(\theta\sqrt{2\pi})^n}\exp\left[\frac{1}{\theta}\sum_{i=1}^n x_i-\frac{1}{2\theta^2}\sum_{i=1}^nx_i^2-\frac{n}{2}\right] \\&=g(\theta,T(\mathbf x))h(\mathbf x)\qquad\forall\,(x_1,\cdots,x_n)\in\mathbb R^n\,,\forall\,\theta\in\mathbb R \end{align} 、ここでおよび。h(x)=1g(θ 、T(x))= 1(θ …

2
UMVUE
ましょう密度からのランダムサンプルである(X1,X2,…,Xn)(X1,X2,…,Xn)(X_1,X_2,\ldots,X_n)fθ(x)=θxθ−110&lt;x&lt;1,θ&gt;0fθ(x)=θxθ−110&lt;x&lt;1,θ&gt;0f_{\theta}(x)=\theta x^{\theta-1}\mathbf1_{00 のUMVUEを見つけようとしています。θ1+θθ1+θ\frac{\theta}{1+\theta} の結合密度は(X1,…,Xn)(X1,…,Xn)(X_1,\ldots,X_n) fθ(x1,⋯,xn)=θn(∏i=1nxi)θ−110&lt;x1,…,xn&lt;1=exp[(θ−1)∑i=1nlnxi+nlnθ+ln(10&lt;x1,…,xn&lt;1)],θ&gt;0fθ(x1,⋯,xn)=θn(∏i=1nxi)θ−110&lt;x1,…,xn&lt;1=exp⁡[(θ−1)∑i=1nln⁡xi+nln⁡θ+ln⁡(10&lt;x1,…,xn&lt;1)],θ&gt;0\begin{align} f_{\theta}(x_1,\cdots,x_n)&=\theta^n\left(\prod_{i=1}^n x_i\right)^{\theta-1}\mathbf1_{00 \end{align} 母集団pdfは1パラメータ指数ファミリに属しているため、これは完全な十分な統計がfθfθf_{\theta}θθ\thetaT(X1,…,Xn)=∑i=1nlnXiT(X1,…,Xn)=∑i=1nln⁡XiT(X_1,\ldots,X_n)=\sum_{i=1}^n\ln X_i 以降、最初の考えで、の私に与えるUMVUEによってレーマン・シェッフェの定理。この条件付き期待値が直接見つかるか、条件付き分布を見つける必要があるかどうかはわかりません 。E(X1)=θ1+θE(X1)=θ1+θE(X_1)=\frac{\theta}{1+\theta}E(X1∣T)E(X1∣T)E(X_1\mid T)θ1+θθ1+θ\frac{\theta}{1+\theta}X1∣∑ni=1lnXiX1∣∑i=1nln⁡XiX_1\mid \sum_{i=1}^n\ln X_i 一方、私は次のアプローチを検討しました: 我々は、つまり。Xi∼i.i.dBeta(θ,1)⟹−2θlnXi∼i.i.dχ22Xi∼i.i.dBeta(θ,1)⟹−2θln⁡Xi∼i.i.dχ22X_i\stackrel{\text{i.i.d}}{\sim}\text{Beta}(\theta,1)\implies -2\theta\ln X_i\stackrel{\text{i.i.d}}{\sim}\chi^2_2−2θT∼χ22n−2θT∼χ2n2-2\theta\, T\sim\chi^2_{2n} したがって、カイ2乗pdfを使用して計算された次の未加工モーメントはrrr−2θT−2θT-2\theta\,TE(−2θT)r=2rΓ(n+r)Γ(n),n+r&gt;0E(−2θT)r=2rΓ(n+r)Γ(n),n+r&gt;0E(-2\theta\,T)^r=2^r\frac{\Gamma\left(n+r\right)}{\Gamma\left(n\right)}\qquad ,\,n+r>0 したがって、異なる整数の選択に対して、異なる整数の累乗の不偏推定量(およびUMVUE)が得られるようです。たとえば、およびとのUMVUEを直接指定してください。rrrθθ\thetaE(−Tn)=1θE(−Tn)=1θE\left(-\frac{T}{n}\right)=\frac{1}{\theta}E(1−nT)=θE(1−nT)=θE\left(\frac{1-n}{T}\right)=\theta1θ1θ\frac{1}{\theta}θθ\theta さて、我々が持っている。θ&gt;1θ&gt;1\theta>1θ1+θ=(1+1θ)−1=1−1θ+1θ2−1θ3+⋯θ1+θ=(1+1θ)−1=1−1θ+1θ2−1θ3+⋯\frac{\theta}{1+\theta}=\left(1+\frac{1}{\theta}\right)^{-1}=1-\frac{1}{\theta}+\frac{1}{\theta^2}-\frac{1}{\theta^3}+\cdots などのUMVUEを確実に取得できます。したがって、これらのUMVUEを組み合わせると、の必要なUMVUEを取得できます。この方法は有効ですか、それとも最初の方法から続行しますか?UMVUEが存在する場合、UMVUEは一意であるため、どちらも同じ答えを返すはずです。1θ,1θ2,1θ31θ,1θ2,1θ3\frac{1}{\theta},\frac{1}{\theta^2},\frac{1}{\theta^3}θ1+θθ1+θ\frac{\theta}{1+\theta} 明確にするために、E(1+Tn+T2n(n+1)+T3n(n+1)(n+2)+⋯)=1−1θ+1θ2−1θ3+⋯E(1+Tn+T2n(n+1)+T3n(n+1)(n+2)+⋯)=1−1θ+1θ2−1θ3+⋯E\left(1+\frac{T}{n}+\frac{T^2}{n(n+1)}+\frac{T^3}{n(n+1)(n+2)}+\cdots\right)=1-\frac{1}{\theta}+\frac{1}{\theta^2}-\frac{1}{\theta^3}+\cdots つまり、E(∑r=0∞Trn(n+1)...(n+r−1))=θ1+θE(∑r=0∞Trn(n+1)...(n+r−1))=θ1+θE\left(\sum_{r=0}^\infty \frac{T^r}{n(n+1)...(n+r-1)}\right)=\frac{\theta}{1+\theta} 場合、必要なUMVUEがである可能性はありますか?∑r=0∞Trn(n+1)...(n+r−1)∑r=0∞Trn(n+1)...(n+r−1)\displaystyle\sum_{r=0}^\infty \frac{T^r}{n(n+1)...(n+r-1)}θ&gt;1θ&gt;1\theta>1 用、私はなるだろう、及びUMVUEが異なることになるので。0&lt;θ&lt;10&lt;θ&lt;10<\theta<1g(θ )= θ (1 + θ + θ2+ ⋯ )g(θ)=θ(1+θ+θ2+⋯)g(\theta)=\theta(1+\theta+\theta^2+\cdots) 最初のアプローチの条件付き期待値を直接見つけることができなかったと確信しており、、私は先に進みました条件付き分布を検索します。そのため、の結合密度が必要でした。E(X1| Σ LNバツ私= t )= E(X1| Π X私= et)E(X1∣∑ln⁡Xi=t)=E(X1∣∏Xi=et)E(X_1\mid \sum\ln …

2
2つのサンプルのカルバックライブラーダイバージェンス
2つのサンプルのカルバックライブラーダイバージェンスの数値推定を実装しようとしました。実装をデバッグするには、2つの正規分布およびからサンプルを引き出します。N(0,1)N(0,1)\mathcal N (0,1)N(1,2)N(1,2)\mathcal N (1,2) 簡単な見積もりの​​ために、2つのヒストグラムを生成し、数値的に積分を近似しようとしました。ヒストグラムの1つのビンがゼロであるヒストグラムのこれらの部分を処理することに行き詰まり、最終的にゼロで除算するか、ゼロの対数で終わらせました。この問題をどのように処理しますか? 関連する質問が頭に浮かびました。2つの異なる一様分布間のKLダイバージェンスを正確に計算する方法は?統合を両方のディストリビューションのサポートの結合に制限する必要がありますか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.