タグ付けされた質問 「bayesian」

ベイズ推定は、モデルパラメータを確率変数として扱い、ベイズの定理を適用して、観測されたデータセットを条件とするパラメータまたは仮説に関する主観的な確率ステートメントを推定することに依存する統計的推定の方法です。

2
ベイジアンはどのようにしてモンテカルロシミュレーション法を使用してメソッドを検証しますか?
背景:私は社会心理学の博士号を取得しており、理論的な統計と数学は私の定量的な授業ではほとんどカバーされていません。学部と大学院を通して、私は(おそらく社会科学の多くの人と同じように)「古典的な」頻出主義の枠組みを通じて教えられました。今、私はまた、Rを愛し、メソッドの作業が行うことを確認するためにシミュレーション手法を使用しての道を数学的な証明よりも私には感覚的です(ここでも、理論的な統計ではなく、量的社会科学の背景)。頻度論的手法とシミュレーション手法を組み合わせることは、私にとって非常に意味のあることです。常連客は確率を長期的なオッズと見なしているためです(たとえば、これを任意の回数実行すると、50%の確率で発生し、50%の確率になります)。モンテカルロ法でこの長期をシミュレーションできます! 合併症:学部生以来、ベイズ法に非常に気づいていて、人生の中でベイズ側に電話をかけてくる人が常にいて、結果の解釈が簡単で、データの代わりに仮説の確率が得られると言ってきました仮説などを与えられました。私は本当にこれに夢中になって、ベイジアンクラスを取り、いくつかのベイジアンの本や論文を読み、現在はスタンとそれに関連するRパッケージにかなり精通しています。 Mayoに入る:「Bayesianはおそらく未来の道だ」としばらく考えた後、私はDeborah Mayoの統計的推論をSevere Testingとして読みました。彼女は本の最初でどちらか一方を選ぶことはないと言いますが、そうします:彼女は常習者であり、本の多くは頻出主義の方法論を擁護しています。私は、彼女が証拠を見る方法が有効であると私たちが考えるかどうかの議論に必ずしも入りたくありませんが、これは私に考えさせました:ベイズが宣伝されているすべては本当にですか?つまり、ベイズの群衆はそれ自体が分裂しているため、ベイジアンフレームワークでデータを分析するための「正しい」方法をよく知りません。通常、私は単に使用しますrstanarm現在のポイントの推定値と信頼できる区間...これは、頻繁に頻度論者の推定値と信頼区間と一致します。私はモデル比較を行うかもしれませんが、ベイズ因子を事後確率比較などとして説明することは常に恐れています。 もっと考える:メイヨーの本を通して私がずっと考えていたのは次のとおりです。コンピュータを使用して頻出主義の方法を確実に機能させる方法があります。なぜなら、確率は長期的に見られるものであり、それをシミュレートできるからです。ベイジアンは、どの確率が実際にあるのかについてさえ合意することができないようです。それは、ベイジアンスクール(デフォルト、主観など)によって異なります。それが私の質問につながります: 質問:長期的に確率が確率として定義されていない場合、モンテカルロシミュレーション法を使用して、ベイズの方法が不確実性を適切に定義している(つまり、有効な信頼できる区間と事後分布を計算する)ことをどのように確認しますか? 例:データジェネレータを作成します。これは、0.5の確率でベルヌーイ分布からシミュレーションを行うだけです。 set.seed(1839) p <- .50 n <- 100 gen_dat <- function(n, p) { rbinom(n, 1, p) } ここで、ロジスティック回帰の信頼区間が実際に有効であることを確認したいとします。回帰を何度もシミュレートして、実際の母集団の値が95%の時間の95%信頼区間内にあることを確認できます。これは切片のみのモデルなので、p正しく推定していることを確認したいだけです。 set.seed(1839) iter <- 10000 results <- sapply(seq_len(iter), function(zzz) { mod <- glm(gen_dat(n, p) ~ 1, binomial) conf <- suppressMessages(confint(mod)) log(p / (1 - p)) < …


2
ベイジアンロジットモデル-直感的な説明?
私は以前、学部生や卒業生のクラスでその用語を聞いたことがないことを告白しなければなりません。 ロジスティック回帰がベイジアンであるとはどういう意味ですか?次のような通常のロジスティックからベイジアンロジスティックへの移行に関する説明を探しています。 これは、線形回帰モデルでの式である:。E(y)=β0+β1x1+...+βnxnE(y)=β0+β1x1+...+βnxnE(y) = \beta_0 + \beta_1x_1 + ... + \beta_nx_n これはロジスティック回帰モデルの方程式です:。これは、yがカテゴリカルの場合に行われます。ln(E(y)1−E(y))=β0+β1x1+...+βnxnln⁡(E(y)1−E(y))=β0+β1x1+...+βnxn\ln(\frac{E(y)}{1-E(y)}) = \beta_0 + \beta_1x_1 + ... + \beta_nx_n 私たちが行っていることは、変更されるへのln (E (Y )E(y)E(y)E(y)。ln(E(y)1−E(y))ln⁡(E(y)1−E(y))\ln(\frac{E(y)}{1-E(y)}) では、ベイジアンロジスティック回帰のロジスティック回帰モデルはどうなりますか?方程式とは関係ないのではないかと思います。 この本のプレビューは定義しているようですが、私にはよくわかりません。この以前の可能性のすべては何ですか?とは?本の一部またはベイジアンロジットモデルを別の方法で誰かが説明してもらえますか?αα\alpha 注:これは以前に尋ねられましたが、あまりよく答えられていないと思います。

2
BUGS / JAGSのようなプログラムはどのようにしてギブスサンプリングの条件付き分布を自動的に決定しますか?
多くの場合、完全な条件文は導出するのが非常に難しいようですが、JAGSやBUGSのようなプログラムはそれらを自動的に導出します。誰かが任意のモデル仕様の完全な条件をアルゴリズム的に生成する方法を説明できますか?

4
ベイジアンの情報のない事前分布と頻度主義の帰無仮説:関係とは?
こちらのブログ投稿でこの画像を見つけました。 この声明を読んでも、この男の場合と同じ顔の表情を引き出せなかったことにがっかりした。 では、帰無仮説は、常連客が情報のない先を表現する方法であるという声明の意味は何ですか?本当ですか? 編集:私は誰かが、少し緩い意味でさえ、声明を真実にする慈善的な解釈を提供できることを望んでいます。

1
ベイジアンネットワークにおけるマルコフブランケットと通常の依存関係
ベイジアンネットワークについて読んでいると、「マルコフブランケット」という用語に出くわし、ベイジアンネットワークグラフでの独立性にひどく混乱しました。 マルコフブランケットは、すべてのノードがその親、子、および子の親にのみ依存していると簡単に述べています[図ではノードAの灰色の領域です]。 このBN、P(M,S,G,I,B,R)P(M,S,G,I,B,R)P(M,S,G,I,B,R)同時確率はどれくらいですか? (ソース:aiqus.com) ステップの親のみの独立性ルールに従う場合、それは次のとおりです。 P(M|S)P(S|G,I)P(I|B)P(R|B)P(G)P(B)P(M|S)P(S|G,I)P(I|B)P(R|B)P(G)P(B) P(M | S)P(S | G,I)P(I | B)P(R | B)P(G)P(B) P(I|G,B)P(I|G,B)P(I|\mathbf{G},B) P(M|S)P(S|G,I)P(I|G,B)P(R|B)P(G)P(B)P(M|S)P(S|G,I)P(I|G,B)P(R|B)P(G)P(B)P(M | S)P(S | G,I)P(I | \mathbf{G},B)P(R | B)P(G)P(B) それでは、このBNの正しい同時確率はどれですか。 更新:AIQUSでのこの質問の相互リンク そして それぞれの章と図は次のとおりです。 代替テキストhttp://img828.imageshack.us/img828/9783/img0103s.png 代替テキストhttp://img406.imageshack.us/img406/3788/img0104l.png

2
分散が等しくない2標本のt検定に対応するベイジアンとは何ですか?
私は、分散が等しくない2標本t検定(ウェルチ検定)の対応するベイズ法を探しています。ホテリングのT統計のような多変量検定も探しています。参考に感謝します。 多変量の場合、と(z 1、⋯ 、z N)があり、y i(resp z i)は標本平均、標本標準偏差と数のショートカットですポイントの。我々は、点の数は、すべてのために同じデータセット全体にわたって一定、標準偏差であると仮定することができ、Y I(それぞれのZ I)のサンプル手段は、Y I(それぞれのZはI(y1,⋯,yN)(y1,⋯,yN)(y_1,\cdots,y_N)(z1,⋯,zN)(z1,⋯,zN)(z_1,\cdots,z_N)yiyiy_iziziz_iyiyiy_iziziz_iyiyiy_iziziz_i)は相関しています。標本平均をプロットすると、それらは互いに続き、それらを接続することにより、滑らかに変化する関数が得られます。現在、いくつかの部分に機能がと一致するZ機能、しかしため他人にそれはないmは電子N (Y Iを)- M eはnは(Z I)yyyzzzが大きくなります。このことを定量化したいと思います。 mean(yi)−mean(zi)std(yi)+std(zi)mean(yi)−mean(zi)std(yi)+std(zi)\frac{mean(y_i)-mean(z_i)}{std(y_i)+std(z_i)}

1
「まばらな事前」という用語は(FBProphet Paper)を何と言いますか?
論文「大規模予測」(FBProphet予測ツール、https: //peerj.com/preprints/3190.pdfを参照)を読んで、「まばらな事前」という用語に出くわしました。著者は、ロジスティック成長モデルのモデルパラメーターであるスカラーレートkからのレート偏差δδ\mathbf{\delta}ベクトルをモデリングする際に、そのような「スパースな事前」を使用していたと説明しています。kkk δj∼Laplace(0,τ)δj∼Laplace(0,τ)\delta_j \sim\text{Laplace}(0,\tau)ττ\taukkkττ\tau また、ラプラス分布を使用して事前共通を生成していますか?なぜ正規分布よりも好まれるのかわかりません。


2
一般化正規分布の提案分布
私は、確率密度関数を持つ一般化された正規分布(wikipediaエントリー)を使用して、植物の分散をモデル化しています。 b2 Γ (1 / B )e− (da)bb2aΓ(1/b)e−(da)b \frac{b}{2a\Gamma(1/b)} e^{-(\frac{d}{a})^b} ここで、は移動距離、はスケールパラメーター、は形状パラメーターです。平均移動距離は、この分布の標準偏差によって与えられます。dddaaabbb a2Γ (3 / b )Γ (1 / b )−−−−−−−−√a2Γ(3/b)Γ(1/b) \sqrt{\frac{a^2 \Gamma(3/b)}{\Gamma(1/b)}} これは、場合は指数関数型、場合はガウス型、場合はレプトリック分布を可能にするため便利です。この分布は、一般的には非常にまれであり、したがって情報を見つけるのが難しいにもかかわらず、植物散布に関する文献で定期的に発生します。b = 1b=1b=1b = 2b=2b=2b &lt; 1b&lt;1b<1 最も興味深いパラメータはと平均分散距離です。bbb 私は推定しようとしていると MCMCを使用して、私はサンプルの提案値への効率的な方法を考え出すのに苦労しています。これまでのところ、私はMetropolis-Hastingsを使用し、および均一分布から描画しました。約200〜400メートルの後方平均分散距離が得られます。これは生物学的に意味があります。ただし、収束は非常に遅く、パラメーター空間全体を調査しているとは思いません。aaabbb0 &lt; a &lt; 4000&lt;a&lt;4000 < a < 400 0 &lt; b &lt; 30&lt;b&lt;3 0 < b<3 とプロポーザル分布をより適切に作成するのは難しいことです。なぜなら、それらは、それ自体にはあまり意味がなく、互いに依存しているためです。平均分散距離は、明確な生物学的な意味を持っていますが、与えられた平均分散距離は無限に多くの組み合わせによって説明できると。このようにとの後方に相関しています。aaabbbaaabbbaaabbb これまでのところ、Metropolis …

3
MAPは解
これらのスライド(スライド#16および#17)は、オンラインコースの1つで見つけました。インストラクターは、最大事後推定値(MAP)が実際にどのようにソリューションであるかを説明しようとしました。ここで、は真のパラメータ。θ ∗L(θ)=I[θ≠θ∗]L(θ)=I[θ≠θ∗]L(\theta) = \mathcal{I}[\theta \ne \theta^{*}]θ∗θ∗\theta^{*} 誰かがこれがどのように続くか説明できますか? 編集:リンクが壊れた場合に備えて、スライドを追加しました。

6
ベイジアン統計を教えるための簡単な実例?
ベイジアン統計を教えるための「実世界の例」をいくつか見つけたいと思います。ベイジアン統計により、以前の知識を正式に分析に組み込むことができます。学生がベイジアン統計を最初に使用したい理由の動機をよりよく理解できるように、事前知識を分析に組み込んだ研究者の簡単な実例を学生に提供したいと思います。 研究者が以前の情報を正式に組み込んでいる、母集団の平均、比率、回帰などの推定など、実際の簡単な例を知っていますか?ベイジアンも「非情報」事前分布を使用できることを知っていますが、私は特に、情報先行(つまり、実際の事前情報)が使用される実際の例に興味があります。

7
感度または特異性は有病率の関数ですか?
標準的な教育では、感度と特異度はテストの特性であり、有病率とは無関係であると述べています。しかし、これは単なる仮定ではありませんか? ハリソンの内科第19版の原則 感度と特異度は、テストの正確さの有病率に依存しないパラメーターであると長い間主張されてきました。ただし、この統計的に有用な仮定は、臨床的に単純化されています。...テストの感度は入院患者の方が高く、テストの特異性は外来患者の方が高いでしょう。 (一般的に有病率は外来患者よりも入院患者で高い) これらのパラメーターの間に数学的またはおおよそのグラフィカルな関係はありますか? このリンクでさえ、それを「単純化」と呼んでいます。どうして? 編集:私は感度がどのように定義されているか知っています。回答で述べられているように、有病期間は含まれていません。私自身も、これらのテストの特性は、使用されている母集団に影響されないということを主張しています。しかし、私は、この混乱はこれらの値の定義ではなく実際的な計算が原因で発生していると思います。特異性と感度は2x2の表を使用して計算されますが、参照母集団の有病率は重要ですか?彼らが言及しているのはそれですか?もしそうなら、その機能は何ですか?

1
事後分布の孤立した極大値を処理できるモンテカルロ/ MCMCサンプラーが実装されていますか?
私は現在、複数のODEで構成されるモデルのパラメーターを推定するためにベイジアンアプローチを使用しています。推定するパラメーターが15個あるので、私のサンプリング空間は15次元であり、事後分布を検索したところ、非常に低い確率の大きな領域によって非常に分離された多くの極大値があるようです。 1つのチェーンが1つの極大値から「ジャンプ」し、誤って他の最大値の1つにヒットすることはほとんどないため、これは私のモンテカルロチェーンの混合問題につながります。 この問題を扱った論文を見つけるのは簡単なので(下記参照)、この分野には多くの研究があるようですが、実際の実装を見つけるのは難しいです。私は分子動力学に関連するパッケージのみを見つけましたが、ベイジアン推論は見つけませんでした。(MC)MCサンプラーの実装で、孤立した極大値を処理できるものはありますか? 私のODEモデルが記述されているため、Matlabでの作業を余儀なくされています。Matlabに関する提案は大歓迎です;-)。ただし、他の言語の "キラーアプリ"がある場合は、PIを切り替えて;-)を説得できます。 私は現在、HaarioやLaineなどによって書かれた遅延拒絶/適応モンテカルロサンプラーを使用しています。、それは私がこれまでに見つけた唯一のサンプラーでもあり、標準のMetropolis-Hastingsアルゴリズムよりも洗練されています 注目すべきアプローチは次のようです。 EDIT 2017-Mar-07に更新しました 開始点が異なる複数の類似したチェーン チェーン間の適応。複数の独立したチェーンによって生成されたプールされたサンプルの経験的共分散行列を使用して、チェーンの提案分布の共分散行列を更新します。(1) 焼戻しが異なる複数のチェーン 和らげる: ある種の「温度」が後部の景観を変化させ、鎖の混合が起こりやすくなるようです。(これについてはまだあまり詳しくありません)(1)調整の目的は、事後確率分布によって形成される(高次元の)確率ランドスケープを平坦化することです。これは通常、事後確率を累乗にすることによって達成されます。ここで、事後ランドスケープは平坦化されます(3、p.298)。つまり、状態の事後確率を計算する代わりに、データが与えられると、調整された事後確率が計算されます。T &gt; 1つのp (θ | D )θ D1 / T1/T1/TT&gt; 1T&gt;1T>1P (θ | D )p(θ∣D)p(\theta\mid D)θθ\thetaDDD p(θ∣D)1/T∝(p(D∣θ)⋅p(θ))1/Tp(θ∣D)1/T∝(p(D∣θ)⋅p(θ))1/Tp(\theta\mid D)^{1/T} \propto \left( p(D\mid\theta)\cdot p(\theta)\right)^{1/T} 高いが選択されると、確率ランドスケープのフラットで幅広いピークになります。したがって、値が大きいほど、サンプラーが1つの極大値から別の極大値に切り替わる確率が高くなります。ただし、は、場合に検索される事後分布ではありません 。したがって、その分布のサンプルのチェーンを使用して、後でからのサンプリングを有効にする必要があります。T P (θ | D )1 / T T ≠ 1つのP (θ | D …

3
線形回帰を行う場合、スロープには情報のない事前情報が必要ですか?
ベイジアン線形回帰を実行する場合、勾配と切片事前分布を割り当てる必要があります。以来、、それが前に均一に割り当てることは理にかなって位置パラメータです。しかし、私はがスケールパラメータに似ているように見え、その前にユニフォームを割り当てるのは不自然に思われます。b b aaaabbbbbbaaa 一方で、線形回帰の傾きに通常の有益ではないジェフリー事前分布()を割り当てることはまったく適切ではないようです。一つには、それは否定的なことができます。しかし、私はそれが他に何であるかを見ることができません。1 / a1/a1/a では、ベイジアン線形回帰の傾きの事前の「適切な」非情報とは何でしょうか。(参考文献をいただければ幸いです。)

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.