タグ付けされた質問 「bayesian」

ベイズ推定は、モデルパラメータを確率変数として扱い、ベイズの定理を適用して、観測されたデータセットを条件とするパラメータまたは仮説に関する主観的な確率ステートメントを推定することに依存する統計的推定の方法です。

1
GPMLでの完全なベイズハイパーパラメーターの選択
周辺尤度(2)を最大化する代わりに、GPMLコードを使用して、ハイパーパラメーター(たとえば、共分散スケール)の近似完全ベイズ(1)選択を実行することは可能ですか?MCMCメソッドを使用して事前にハイパーパラメーターを含む積分を解くと、オーバーフィッティングを処理するときにより良い結果が得られると思います。私の知る限りでは、GPMLフレームワークにはこれらの計算は含まれていませんが、おそらく他のサードパーティのコードがあります。 (1)秒 5.2、Ch。機械学習のためのガウス過程における5、Rasmussen&Williams、2006 (2)GPMLドキュメントの「回帰」セクション

1
ベータ事前分布は二項尤度の下で事後にどのように影響しますか
2つの質問があります。 質問1:可能性が二項であり、事前分布がベータである場合、事後分布がベータ分布であることをどのように示すことができますか 質問2:以前のパラメーターの選択は事後にどのように影響しますか?それらはすべて同じである必要はありませんか? Rでこれらの質問に答えることは可能ですか?

1
比率の違いに関する階層ベイズ分析
なぜ階層的なのか?:私はこの問題を調査してみましたが、私が理解しているところによると、これは「階層的な」問題です。なぜなら、あなたはその集団から直接観察するのではなく、集団からの観察について観察しているからです。リファレンス:http : //www.econ.umn.edu/~bajari/iosp07/rossi1.pdf なぜベイジアンなのか?:また、各セルに十分な観測値が割り当てられている「実験計画」には漸近/頻出解が存在する可能性があるため、ベイジアンとしてタグ付けしましたが、実際の目的では、実世界/非実験データセット(または最小のもの)はまばらに移入されています 集計データは多数ありますが、個々のセルが空白であるか、観測値が少ない場合があります。 抽象的モデル: Uを単位母集団とする。。。u NのそれぞれにAまたはBのいずれかの処理Tを適用でき、それぞれから1または0の別名の成功と失敗のiid観測を観測します。ましょうP I TのためのI ∈ { 1 ... Nは}オブジェクトから観察する確率であるI処置下Tの成功をもたらします。なお、P Iu1,u2,u3...uNu1,u2,u3...uN{u_1, u_2, u_3 ... u_N}TTTAAABBBpiTpiTp_{iT}i∈{1...N}i∈{1...N}i \in \{1...N\}iiiTTTpiApiAp_{iA}と相関している可能性があります。piBpiBp_{iB} 分析を実行可能にするために、(a)分布とp Bはそれぞれベータ分布などの特定の分布のファミリーのインスタンスであると想定し、(b)ハイパーパラメーターのいくつかの以前の分布を選択します。pApAp_ApBpBp_B モデルの例 マジック8ボールの大きなバッグを持っています。各8ボールを振ると、「はい」または「いいえ」が表示されます。また、ボールを上下逆さまにしたり、上下逆さまに振ったりすることもできます(Magic 8 Ballが上下逆さまに動作すると仮定します...)。ボールの向きが完全に「はい」か「いいえ」で結果の確率を変更することがあり(つまり、最初にあなたがいることを全く信じていないと相関しているのp のi Bを)。piApiAp_{iA}piBpiBp_{iB} 質問: 誰かが集団から無作為にのユニットをサンプリングし、各ユニットについて、処理Aの下で任意の数の観測値と処理Bの下で任意の数の観測値を取得して記録しました。(実際には、私たちのデータセットでは、ほとんどのユニットは1つの処理でのみ観測されます)nnnAAABBB このデータから、次の質問に答える必要があります。 母集団からランダムに新しい単位を取得する場合、p x Aとp x Bの同時事後分布を(分析的または確率的に)どうやって計算できますか?(主に、予想される比率の差を決定できるようにするため、Δ = p x A − p x B)uxuxu_xpxApxAp_{xA}pxBpxBp_{xB}Δ=pxA−pxBΔ=pxA−pxB\Delta=p_{xA}-p_{xB} 特定のユニットの、Y ∈ { 1 …

2
古典的なNNよりもベイズの正則化されたNN
古典的なニューラルネットワークは通常、十分な汎化能力を欠いており、通常は不正確な予測をもたらすと主張するいくつかの研究記事を見てきました。ベイズの正則化ANN(BRANN)は、標準の逆伝播ネットよりも堅牢であり、長い相互検証の必要性。 ただし、これらの記事は、この主張に対して適切な理由付け/正当化を行うには不十分です。 BRANNはどのような方法で、またはどのような目的で従来のNNよりも優れていますか?なぜ?

1
情報がない事前分布の選択
モデルの一部でキャリブレーション関数として機能する醜いパラメーター化された関数に依存するモデルに取り組んでいます。ベイジアン設定を使用して、関数を説明するパラメーターについて、情報を提供しない事前情報を取得する必要があります。理想的には、参照または少なくともジェフリーズ事前分布を導出する必要があることを知っていますが、関数は非常に醜く、多くのパラメーターがあり、実際に結果を得る可能性について悲観的です。それで、私はこの可能性を落とし、彼らが非常に有益でないようにそれらを詮索する私の前の経験的に経験的に選ぶことにしました。これが私の2つの質問です。 詮索好き以上のものを作って、推論結果から彼らの非情報性について洞察を与えることはできますか?編集:事後Vs以前のプロットが最初のポイントになると思います。たぶん、MAPとMLの推定値を比較することは、2番目の引数かもしれません。 さらに、それは「次元分析」からの選択のいくつかの側面を正当化するのに意味がありますか?例として、私は(簡単な回帰設定で)形の可能性の構造を考慮した場合: DOは、あなたは、私が上で事前のための任意の「構造」を推測することができると思いますし、B 1が重さという事実に基づいて、Xを、他方の重さE のx?Y|a,b,x=a.x+b.e−x+ϵY|a,b,x=a.x+b.e−x+ϵ Y | a,b,x = a.x+b.e^{-x} + \epsilon aaabbbxxxexexe^x

2
事前ヒストグラムによるベイズ分析。なぜ後方からシミュレーションを描くのですか?
これは、ジムアルバートの「Rを使用したベイジアン計算」の演習に関する初心者の質問です。これは宿題かもしれませんが、私の場合はそうではないことに注意してください。私はRでベイズ法を学んでいるので、将来の分析でそれを使用するかもしれないと思うからです。 とにかく、これは特定の質問ですが、おそらくベイズ法の基本的な理解が関係しています。 したがって、エクササイズ2.2では、ジムアルバートがペニースローの実験を分析するように求めています。こちらをご覧ください。事前ヒストグラムを使用します。つまり、可能なp値のスペースを10の長さの間隔で分割し.1、事前確率をこれらに割り当てます。 私は真の確率がになることを知っており.5、宇宙が確率の法則を変更したり、ペニーが頑丈である可能性は非常に低いと思うので、私の事前確率は次のとおりです。 prior <- c(1,5,20,100,5000,5000,100,20,5,1) prior <- prior/sum(prior) 区間中点に沿って midpt <- seq(0.05, 0.95, by=0.1) ここまでは順調ですね。次に、ペニーを20回スピンし、成功(ヘッド)と失敗(テール)の数を記録します。簡単にできます: y <- rbinom(n=20,p=.5,size=1) s <- sum(y==1) f <- sum(y==0) 私の支出では、s == 7そしてf == 13。次に私が理解していない部分があります: (1)(0,1)の値のグリッドでpの事後密度を計算し、(2)グリッドから置き換えてシミュレートしたサンプルを取得することにより、事後分布からシミュレートします。(関数 histpriorとsampleはこの計算に役立ちます)。データに基づいて間隔確率はどのように変化しましたか? これがどのように行われるかです: p <- seq(0,1, length=500) post <- histprior(p,midpt,prior) * dbeta(p,s+1,f+1) post <- post/sum(post) ps <- sample(p, replace=TRUE, …

1
宿題:ベイジアンデータ分析:両方の二項パラメーターの事前分布
以下は、Bayesian Data Analysis 2nd ed、p。97. Andrew Gelmanは彼のウェブサイトのガイドにそのソリューションを含めておらず、一日中私を夢中にさせてきました。文字通り一日中。 yyyNNNθθ\thetaNNNPr(N|μ)=Poisson(μ)Pr(N|μ)=Poisson(μ)\Pr(N|\mu) = Poisson(\mu)μμ\mu(N,θ)(N,θ)(N, \theta)λ=μθλ=μθ\lambda=\mu\thetaNNNp(λ,θ)∝1/λp(λ,θ)∝1/λp(\lambda, \theta) \varpropto 1/\lambda。 私がハングアップしている問題の一部は、変数を変換してを決定する方法です。p(N,θ)p(N,θ)p(N, \theta) 私が試みたアプローチは、記述し、積分によって不要なを排除することです。つまり、、そしてを関係置き換えます。このアプローチは、に減少します。ここで、は(3)から導入された比例定数です。 p(N,θ|λ)p(λ,θ)p(N,θ|λ)p(λ,θ)p(N,\theta|\lambda)p(\lambda, \theta)λλ\lambdap(N,θ)=∫∞0CμN/(exp(μ)λN!)dλp(N,θ)=∫0∞CμN/(exp(μ)λN!)dλp(N,\theta)=\int_0^\infty C\mu^N/(exp(\mu)\lambda N!)d\lambdaμμ\muμ=λ/θμ=λ/θ\mu=\lambda/\thetap(N,θ)=C/(N+1)p(N,θ)=C/(N+1)p(N,\theta)=C/(N+1)CCC この結果は、懸念を私に、それはいくつかの値の同時確率ということを意味するのでとのみに依存してではなく、。さらに、いくつかの漠然とした鐘が、非常に老朽化した多変数計算から鳴り響き、ヤコビアンと座標変換について思い出させようとしていますが、この統合アプローチが適切であるかどうかはわかりません。θθ\thetaNNNNNNθθ\theta 私はあなたの助けと洞察に感謝します。

1
標準HMMからベイジアンHMMへ
標準HMMとベイジアンHMMの違いを理解しようとしています。ウィキペディアはモデルがどのように見えるかを簡単に述べていますが、より詳細なチュートリアルが必要です。誰かが私が見ることができる論文や実装を知っていますか? また、使用する用語に問題があります。「配布の前にディリクレを配置/配置する」とはどういう意味ですか?

1
ディリクレ分布パラメーターのベイズ推定
ギブスサンプリングを使用してディリクレ混合モデルのパラメーターを推定したいのですが、いくつか質問があります。 ディリクレ分布の混合はディリクレ過程と同等ですか?そうでない場合の主な違いは何ですか? また、単一のディリクレ分布のパラメーターを推定する場合、ベイジアンフレームワークで事前分布として選択するパラメーターの分布はどれですか? すべての論文で、ディリクレ事前分布を使用した多項分布の推定を見つけました。多項式の事前分布を使用してディリクレ分布を推定する必要があるかもしれません。 事後関数もDIRICHLET(α+ N)の形式で、「ディリクレ事前分布を使用した多項分布の推定」の場合と同様ですか?iidサンプルの確率密度関数の乗算は、尤度関数の定義では考慮されないためです。理由がわかりません。 たとえば、この論文で述べたように:http : //www.stat.ufl.edu/~aa/cda/bayes.pdf または http://research.microsoft.com/en-us/um/people/minka/papers/ minka-multinomial.pdf あなたの注意をありがとう 私のデータはHyperion(一種のハイパースペクトルリモートセンシング画像)であり、ディリクレソースの混合を使用してハイパースペクトルアンミキシングを実行し、パラメーター推定にギブスサンプリング法を適用します。私のデータは次元(614 * 512 * 224)です。これは、Cuprite Nevada地区で一般的に利用可能なAVIRISセンサーデータであり、ほぼ200MBです。また、このデータは(http://aviris.jpl.nasa.gov/data/free_data.html)から入手できます。残念ながら、データを送信する方法を知りません。 私のPHD論文の統計モデリングタスクを手伝ってくれるようお願いします。私のモデリングの混乱を解決するのを手伝ってくれるなら、とても感謝しています。 すべての最高のソルマズ

3
SPSSを使用した2x3混合設計ANOVAの事後テスト?
実験中に3回評価された10人の参加者の2つのグループがあります。グループ間および3つの評価全体の違いをテストするために、group(コントロール、実験)、time(最初、2、3)、およびを使用して2x3混合設計ANOVAを実行しましたgroup x time。両方timeとgroup有意な相互作用があったほか、重大な結果group x time。 グループメンバーシップに関しても、3回の評価の違いをさらにチェックする方法をよく知りません。実際、最初は、ANOVAのオプションで、ボンフェローニの補正を使用してすべての主要な効果を比較することだけを指定しました。しかし、この方法で、グループを区別せずに、サンプル全体の時間の違いをこのように比較したことに気付きましたね。 したがって、可能な解決策を見つけるためにインターネットでたくさん検索しましたが、結果はほとんどありませんでした。私と同じようなケースは2つしか見つかりませんでしたが、解決策は逆です! 記事では、混合設計の後、著者らは被験者ごとに1つずつ、2回の反復測定ANOVAを事後的に実行しました。このようにして、2つのグループは修正なしで個別に分析されます。 インターネットのガイドでは、混合ANOVAの実行中に、SPSS構文のCOMPARE(time) ADJ(BONFERRONI)直後にを手動で追加すると述べています/EMMEANS=TABLES(newgroup*time)。このように、3つの時間はグループごとに個別に比較されます。ボンフェローニ補正を使用すると、私は正しいのでしょうか。 どう思いますか?どちらが正しい方法でしょうか?
8 anova  mixed-model  spss  post-hoc  bonferroni  time-series  unevenly-spaced-time-series  classification  normal-distribution  discriminant-analysis  probability  normal-distribution  estimation  sampling  classification  svm  terminology  pivot-table  random-generation  self-study  estimation  sampling  estimation  categorical-data  maximum-likelihood  excel  least-squares  instrumental-variables  2sls  total-least-squares  correlation  self-study  variance  unbiased-estimator  bayesian  mixed-model  ancova  statistical-significance  references  p-value  fishers-exact  probability  monte-carlo  particle-filter  logistic  predictive-models  modeling  interaction  survey  hypothesis-testing  multiple-regression  regression  variance  data-transformation  residuals  minitab  r  time-series  forecasting  arima  garch  correlation  estimation  least-squares  bias  pca  predictive-models  genetics  sem  partial-least-squares  nonparametric  ordinal-data  wilcoxon-mann-whitney  bonferroni  wilcoxon-signed-rank  traminer  regression  econometrics  standard-error  robust  misspecification  r  probability  logistic  generalized-linear-model  r-squared  effect-size  gee  ordered-logit  bayesian  classification  svm  kernel-trick  nonlinear  bayesian  pca  dimensionality-reduction  eigenvalues  probability  distributions  mathematical-statistics  estimation  nonparametric  kernel-smoothing  expected-value  filter  mse  time-series  correlation  data-visualization  clustering  estimation  predictive-models  recommender-system  sparse  hypothesis-testing  data-transformation  parametric  probability  summations  correlation  pearson-r  spearman-rho  bayesian  replicability  dimensionality-reduction  discriminant-analysis  outliers  weka 

4
ベイジアン分類子は、数値メタデータを含むテキストに適したアプローチですか?
私のウェブサイトで詐欺広告を検出するためのアプローチを考え出そうとしています。詐欺を示す信号の多くは広告のテキスト内に見つかるので、問題はスパムメールの検出(多くの場合、単純なベイジアン分類器が一般的な解決策です)と多くの共通点があると思います。 ただし、他にも特定の詐欺インジケーターになる可能性のある情報がありますが、ベイズ分類器がそれらを使用できるかどうか/どのように使用できるかはわかりません。数値が関係しているためです(範囲の両端の値が疑わしいため)。テキスト内の単語の有無に対応する単純なバイナリ値よりも。 たとえば、多くの詐欺広告では、アイテムの価格が非常に低く設定されている(多くの視聴を引き付けるため)ので、広告が詐欺である可能性があることを示す強力な指標として、通常よりも低い価格を設定します。 ベイズはまだ私の要件に適していますか?そうでない場合は、別のアプローチをお勧めできますか?

1
階層ベイズ分析で被験者を比較するときに使用するレベルは何ですか?
多くの被験者の反応時間をテストする実験があり、各被験者が多くの反応時間の試行を行っているとします。ベイジアンフレームワークでは、反応時間()は、被験者レベルと被験者グループ全体の両方に事前分布がある階層モデルによってモデル化できます。モデルの図、クルシュケスタイルは次のようになります。yyy ...そして対応するバグ/ジャグコードは次のようになります: for(i in 1:length(y)) { y[i] ~ dnorm(mu[subj[i]], tau[subj[i]]) } for(j in 1:nbr_of_subjects) mu[subj[i]] ~ dnorm(M_mu, P_mu) tau[subj[i]] ~ dgamma(S_tau, R_tau) } M_mu ~ dnorm(M_M, P_M) P_mu ~ dgamma(S_P, R_P) S_tau <- pow(m , 2) / pow(sd, 2) R_tau <- m / pow(sd, 2) m ~ dgamma(S_m, R_m) sd …

3
理論、仮説、または問題に取り組むためにベイジアンアプローチが重要だったのはいつですか?
最近、リストサーブに質問が投稿されました。私は(おそらく皮肉なことに)生態学の分野での質問に対処するためにベイジアンのアプローチが「仕事を成し遂げる」ために非常に重要である場合、一般的に、ベイジアンアプローチが特定の分野で進歩するために不可欠であった時期について、私は疑問に思っています。 生態学では、ベイジアン法は大きく複雑なデータセットを使用する適用状況で最も頻繁に使用されるように思われるため、フィールドの重要または古典的な理論または仮説に関連する状況に特に関心があります。 たとえば、生態学では、ベイズ法が複雑な階層モデルに適合し、動物の個体数や生き物の個体数における個体の生存率などの正確な推定値を取得する唯一の方法のようです。ベイジアンアプローチが使用されたために、理論的な質問の書き込みが進行した例に精通していませんが、これは、p値が歴史的に評価された通貨であるANOVAのようなフレームワークにおける還元論的実験で生態学理論がしばしば対処されるためである可能性があります。

1
ベイズの定理を使用する場合の信頼区間
いくつかの条件付き確率と、95%の信頼区間を計算しています。私のケースの多くでは、(分割表からの)試行からのx成功の単純なカウントがあるnため、で提供さbinom.confint(x, n, method='exact')れてRいるような二項信頼区間を使用できます。 しかし、他の場合では、そのようなデータがないので、ベイズの定理を使用して、持っている情報から計算します。たとえば、イベントおよび与えられた場合:baaabbb P(a | b )= P(B |)⋅ P(a )P(b )P(a|b)=P(b|a)⋅P(a)P(b) P(a|b) = \frac{P(b|a) \cdot P(a)}{P(b)} \ textrm {binom.confint}(\#\ left(b \ cap {} a)、\#(a)\ right)を使用してP(b | a)の周りの95%信頼区間を計算でき、比率P(a)/ P(b)を周波数比\#(a)/ \#(b)として。この情報を使用してP(a | b)の周囲の信頼区間を導出することは可能ですか?P(b | a )P(b|a)P(b|a)binom.confint(#(B ∩a )、#(a ))binom.confint(#(b∩a),#(a))\textrm{binom.confint}(\#\left(b\cap{}a),\#(a)\right)P(a )/ P(b )P(a)/P(b)P(a)/P(b)#(a )/#(b )#(a)/#(b)\#(a)/\#(b)P(a | b )P(a|b)P(a|b) ありがとう。

2
逆ガンマ分布は
事後推定値と仮定する前に正常尤度と逆ガンマのσ 2は:ですσ′2σ』2\sigma'^{2}σ2σ2\sigma^2 σ′2∼IG(α+n2,β+∑ni=1(yi−μ)22)σ』2〜IG(α+ん2、β+Σ私=1ん(y私−μ)22)\sigma'^{2}\sim\textrm{IG}\left(\alpha + \frac{n}{2}, \beta +\frac{\sum_{i=1}^n{(y_i-\mu)^2}}{2}\right) これは σ′2∼IG(n2,nσ22)σ』2〜IG(ん2、んσ22)\sigma'^{2}\sim\textrm{IG}\left( \frac{n}{2}, \frac{n\sigma^2}{2}\right) 弱いのでに先立っσ 2削除しαおよびβ EQN 1:IG(α,β)IG(α、β)\textrm{IG}(\alpha, \beta)σ2σ2\sigma^2αα\alphaββ\beta σ′2∼IG(n2,∑ni=1(yi−μ)22)σ』2〜IG(ん2、Σ私=1ん(y私−μ)22)\sigma'^{2}\sim\textrm{IG}\left( \frac{n}{2}, \frac{\sum_{i=1}^n{(y_i-\mu)^2}}{2}\right) それの後方推定することは明らかであるサンプルサイズと尤度の二乗和の関数です。しかし、これはどういう意味ですか?ウィキペディアには、私があまり従わない派生物があります。σ2σ2\sigma^2 次の質問があります ベイズの法則を呼び出さずにこの2番目の方程式に到達できますか?通常の尤度とは無関係に平均と分散に関連するIGのパラメーターに固有の何かがあるかどうか私は興味があります。 私は通知前に推定するために、以前の研究から、サンプルサイズと標準偏差を使用することはでき、その後、新しいデータで前の更新しますか?これは簡単なように見えますが、そうした例や、これが正当なアプローチである理由を説明することはできません。σ2σ2\sigma^2 詳細な説明について相談できる人気の確率または統計のテキストはありますか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.