タグ付けされた質問 「posterior」

ベイズ統計のデータを条件とするパラメーターの確率分布を指します。

3
ベイズの事前分布と事後分布の理解を助けてください
学生のグループでは、18人のうち2人が左利きです。情報価値のない事前分布を仮定して、人口の左利きの学生の事後分布を見つけます。結果を要約します。文献によると、5-20%の人が左利きです。事前にこの情報を考慮し、新しい事後を計算します。 私が知っているベータ分布は、ここで使用する必要があります。まず、αα\alphaとββ\beta値を1にして?事後の資料で見つけた方程式は π(r|Y)∝r(Y+−1)×(1−r)(N−Y+−1)π(r|Y)∝r(Y+−1)×(1−r)(N−Y+−1)\pi(r \vert Y ) \propto r^{(Y +−1)} \times (1 − r)^{(N−Y +−1)} \\ Y=2Y=2Y=2、N=18N=18N=18 なぜそのrrrは方程式にあるのですか?(rrrは左利きの人々の割合を示します)。不明ですが、この方程式にはどのように当てはまりますか?私には計算にばかげrrr与えられたYYY、その使用rrr与える式でrrr。さて、サンプルとr=2/18r=2/18r=2/18の結果であった0,00190,00190,0019。fff私がそれから推測する必要がありますか? 期待値を与える式RRR知られて与えられたYYYとNNN、より良い仕事をしてくれました0,150,150,15権利について鳴ります。方程式は、値はおよび割り当てられます。事前情報を考慮するために、とにどの値を指定する必要がありますか?E(r|X,N,α,β)=(α+X)/(α+β+N)E(r|X,N,α,β)=(α+X)/(α+β+N)E(r | X, N, α, β) = (α + X)/(α + β + N)111αααβββαααβββ いくつかのヒントをいただければ幸いです。事前分布と事後分布に関する一般的な講義も害になりません(私はそれらが何であるかを曖昧に理解していますが、曖昧です)高度な数学はおそらく私の頭の上を飛ぶでしょう。

1
事後予測チェックとは何ですか?また、それらを有用にするものは何ですか?
事後予測分布が何であるかを理解し、事後予測チェックについて読んでいますが、それが何をするのかはまだ明確ではありません。 事後予測チェックとは正確には何ですか? 一部の著者は、事後予測チェックの実行は「データを2回使用する」ため、悪用すべきではないと言うのはなぜですか?(または、それがベイジアンではないこともあります)?(例:thisまたはthisを参照) このチェックは、まさに何の役に立つのですか?モデル選択に本当に使用できますか?(たとえば、フィットネスとモデルの複雑さの両方を考慮しますか?)

3
事後予測分布と事後予測分布の違いは何ですか?
後部が何であるかは理解していますが、後部の意味がわかりませんか? 2はどう違いますか? Kevin P Murphyは、彼の教科書であるMachine Learning:a Probabilistic Perspectiveで、「内部の信念状態」であることを示しました。それはどういう意味ですか?プライアーはあなたの内なる信念や偏見を表しているという印象を受けましたが、どこが間違っているのでしょうか?

3
不適切な事前はどのようにして適切な事後分布に導くことができますか?
適切な事前配布の場合、 P(θ∣X)=P(X∣θ)P(θ)P(X)P(θ∣X)=P(X∣θ)P(θ)P(X)P(\theta \mid X) = \dfrac{P(X \mid \theta)P(\theta)}{P(X)} ∝P(X∣θ)P(θ)∝P(X∣θ)P(θ) \propto P(X \mid \theta)P(\theta)。 このステップのための通常の正当化は、周辺分布することである、、に対して一定であると事後分布を導出する際に、したがって無視することができます。XXXP(X)P(X)P(X)θθ\theta しかし、不適切な事前分布の場合、事後分布が実際に存在することをどのように知っていますか?この一見円形の議論には何かが欠けているようです。つまり、事後が存在すると仮定した場合、事後を導出する方法のメカニズムは理解しますが、事後が存在する理由についての理論的正当性が欠落しているようです。 PS私はまた、不適切な事前が不適切な事後につながる場合があることを認識しています。


6
事後と事前および尤度とは非常に異なる
事前確率と尤度が互いに非常に異なる場合、事後がどちらにも似ていない状況が発生することがあります。たとえば、正規分布を使用するこの図を参照してください。 これは数学的には正しいですが、私の直感とは一致していないようです-データが強く保持されている信念またはデータと一致しない場合、どちらの範囲もうまくいかないと予想し、フラットな後方範囲全体または恐らく事前確率と尤度周辺の二峰性分布(どちらがより論理的な意味を持っているかはわかりません)。私は確かに、私の以前の信念やデータのいずれにも一致しない範囲の周りのきつい後方を期待しないでしょう。より多くのデータが収集されると、事後確率が尤度に向かって移動することを理解していますが、この状況では直感に反するように思われます。 私の質問は次のとおりです。この状況に対する私の理解はどのように欠陥がありますか(または欠陥がありますか)。後部は、この状況の「正しい」関数です。そうでない場合、他にどのようにモデル化できますか? 完全を期すために、事前確率はとして与えられ、尤度はとして与えられます。N(μ = 6.1 、σ = 0.4 )N(μ = 1.5 、σ= 0.4 )N(μ=1.5、σ=0.4)\mathcal{N}(\mu=1.5, \sigma=0.4)N(μ = 6.1 、σ= 0.4 )N(μ=6.1、σ=0.4)\mathcal{N}(\mu=6.1, \sigma=0.4) 編集:与えられた答えのいくつかを見て、私は非常によく状況を説明していないように感じています。私のポイントは、ベイジアン解析は非直感的な結果をもたらすように思われた特定のモデルで仮定。私の望みは、おそらく悪いモデルの決定について、事後部が何らかの形で「説明」することでした。これについては、回答で詳しく説明します。

2
頻度統計の暗黙の事前分布とは何ですか?
ジェインズは、頻繁な活動家が「暗黙の事前」で活動していると主張するという考えを聞いたことがあります。 これらの暗黙の優先順位は何ですか?これは、頻繁なモデルがすべて、ベイジアンモデルの発見を待っている特別なケースであることを意味しますか?

2
海で失われた漁師の探索にベイズの定理を適用する方法
The Odds、Continually Updatedの記事では、文字通りベイジアン統計に人生を負っているロングアイランドの漁師の話に言及しています。これが短いバージョンです: 夜中にボートに乗っている2人の漁師がいます。一方が眠っている間に、もう一方は海に落ちます。ボートは、最初の男が目を覚まして沿岸警備隊に通知するまで、オートパイロットで夜中ずっと動き回っています。沿岸警備隊は、SAROPS(Search and Rescue Optimal Planning System)と呼ばれるソフトウェアを使用して、体温が低く、浮かんでいるエネルギーがほとんどないので、適時に彼を見つけました。 ここに長いバージョンがあります:海のスペック ここで、ベイズの定理が実際にどのように適用されているかをもっと知りたいと思いました。グーグルで調べただけで、SAROPSソフトウェアについてかなりのことがわかりました。 SAROPSシミュレーター シミュレータコンポーネントは、海流、風などのタイムリーなデータを考慮に入れ、数千の可能なドリフトパスをシミュレートします。これらのドリフトパスから、確率分布マップが作成されます。 次の図は、上記の行方不明の漁師の場合を示しているのではなく、このプレゼンテーションから取ったおもちゃの例です 確率マップ1(赤は最も高い確率を示し、青は最も低い確率を示します) 開始位置である円に注意してください。 確率マップ2-さらに時間が経過しました 確率マップがマルチモーダルになっていることに注意してください。これは、この例では、複数のシナリオが考慮されているためです。 人は水に浮かんでいます-トップミドルモード 人は救命いかだに乗っています(北からの風の影響がより大きくなります)-下2つのモード(「ジャイブ効果」のために分割されます) 確率マップ3-赤の長方形のパスに沿って検索が行われました。 この画像は、プランナー(SAROPSの別のコンポーネント)によって生成された最適なパスを示しています。ご覧のとおり、これらのパスが検索され、シミュレータによって確率マップが更新されています。 検索されたエリアがゼロ確率に減らされていないのはなぜだろうと思うかもしれません。これは、失敗の可能性が考慮されているためです。つまり、検索者が水中の人を見落とす可能性が無視できないことです。当然、失敗の確率は、救命いかだにいる人よりも浮いている孤独な人の方がはるかに高く(見やすい)、そのため、上部の領域の確率はあまり下がっていません。p(fail)p(fail)p(\text{fail}) 失敗した検索の影響 これが、ベイズの定理が登場する場所です。検索が実行されると、それに応じて確率マップが更新されるため、別の検索を最適に計画できます。 ベイズ確認した後の定理をウィキペディアにして記事のアン直感的(ショート)ベイズの説明定理にBetterExplained.com ベイズの方程式を取りました。 P(A∣X)=P(X∣A)×P(A)P(X)P(A∣X)=P(X∣A)×P(A)P(X) P(\text{A}\mid\text{X}) = \frac{P(\text{X}\mid\text{A}) \times P(\text{A})}{P(\text{X})} そして、次のようにAとXを定義しました... イベントA:このエリアにいる人(グリッドセル) テストX:そのエリア(グリッドセル)での検索の失敗、つまりそのエリアを検索しても何も表示されなかった 降伏、 P(そこにいる人∣ 不成功)= P(失敗∣ そこに人)× P(人がいる)P(失敗)P(person there∣unsuccessful)=P(unsuccessful∣person there)×P(person there)P(unsuccessful) P(\text{person there}\mid\text{unsuccessful}) = \frac{P(\text{unsuccessful}\mid\text{person there}) …

2
事後分布をすでに知っているのに、なぜ事後分布からサンプリングする必要があるのですか?
私の理解では、ベイズのアプローチを使用してパラメータ値を推定するときは次のとおりです。 事後分布は、事前分布と尤度分布の組み合わせです。 事後分布からサンプルを生成することでこれをシミュレートします(たとえば、Metropolis-Hastingアルゴリズムを使用して値を生成し、それらが事後分布に属する確率の特定のしきい値を超える場合は受け入れます)。 このサンプルを生成したら、それを使用して事後分布とその平均などを近似します。 しかし、私は何かを誤解しているに違いないと感じています。事後分布があり、そこからサンプリングし、そのサンプルを事後分布の近似値として使用しているように聞こえます。しかし、なぜ事後分布があるのか​​というと、なぜそこからサンプリングして近似する必要があるのでしょうか?

4
情報量の少ないまたは主観的な事前分布を通常使用する場合、ベイジアンフレームワークの解釈はどのように改善されますか?
それはデータ与えられたパラメータの確率を計算するので、それは多くの場合、(frequentist以上)ベイズフレームワークは解釈の大きな利点を持っていると主張している-の代わりに、のように、頻繁なフレームワーク。ここまでは順調ですね。p (x | θ )p (θ | x )p(θ|x)p(\theta|x)p (x | θ )p(x|θ)p(x|\theta) しかし、それが基づいている全体の方程式: p (θ | x )= p(x | θ )。p (θ )p (x )p(θ|x)=p(x|θ).p(θ)p(x)p(\theta|x) = {p(x|\theta) . p(\theta) \over p(x)} 私には2つの理由で少し疑っています: 多くの論文では、通常、情報量の少ない事前分布(均一分布)が使用され、その後のみが使用されます。ベイジアン事後確率と頻度論者の可能性が同じ分布である場合の解釈?同じ結果が得られます。p (θ | x )=p (x | θ )p(θ|x)=p(x|θ)p(\theta|x) = p(x|\theta) 有益な事前分布を使用すると、異なる結果が得られますが、ベイジアンは主観的な事前分布の影響を受けるため、全体にも主観的な色合いがあります。p (θ | x )p(θ|x)p(\theta|x) …

1
多変量正規後部
これは非常に単純な質問ですが、インターネットまたは本のどこにも派生物が見つかりません。1つのベイジアンが多変量正規分布を更新する方法の導出を確認したいと思います。例:想像してみてください P(x|μ,Σ)P(μ)==N(μ,Σ)N(μ0,Σ0).P(x|μ,Σ)=N(μ,Σ)P(μ)=N(μ0,Σ0). \begin{array}{rcl} \mathbb{P}({\bf x}|{\bf μ},{\bf Σ}) & = & N({\bf \mu}, {\bf \Sigma}) \\ \mathbb{P}({\bf \mu}) &= & N({\bf \mu_0}, {\bf \Sigma_0})\,. \end{array} {\ bf x_1 ... x_n}のセットを観察した後、\ mathbb {P}({\ bf \ mu | x_1 ... x_n})x1...xnx1...xn{\bf x_1 ... x_n}を計算したいと思います。答えは\ mathbb {P}({\ bf \ mu | x_1 ... x_n})= …

1
この事後分布の図の何が問題になっていますか?
私は、事後確率分布が事前分布と尤度分布の組み合わせである方法の実例であると言われている次の画像を持っています。 私は、画像に何か問題がある、つまり事後分布は尤度関数の形式を与えられた形式にできないと言われました。しかし、私はイメージのどこが悪いのか考えるのに苦労しています。 事後確率は可能性が高いように見えますが、事前分布によって右に引っ張られます。これは、何が起こるべきかについての私の理解と一致し、理にかなっています。誰が間違っているのか知っていますか? 私の唯一の考えは、後部の下の領域が尤度の下の領域よりわずかに小さいかもしれないということです。これは、後部が可能性よりも少し太いように思えますが、これは非常にうるさい側面です。

2
多変量ガウス分布の共分散事後分布の推定
サンプル数の少ない2変量ガウス分布を「学習」する必要がありますが、事前分布に関する仮説は良好なので、ベイジアンアプローチを使用したいと思います。 :私は私の前に定義された P(μ)∼N(μ0,Σ0)P(μ)∼N(μ0,Σ0) \mathbf{P}(\mathbf{\mu}) \sim \mathcal{N}(\mathbf{\mu_0},\mathbf{\Sigma_0}) μ0=[00] Σ0=[160027]μ0=[00] Σ0=[160027] \mathbf{\mu_0} = \begin{bmatrix} 0 \\ 0 \end{bmatrix} \ \ \ \mathbf{\Sigma_0} = \begin{bmatrix} 16 & 0 \\ 0 & 27 \end{bmatrix} そして、私の分布は、仮説与えられた P(x|μ,Σ)∼N(μ,Σ)P(x|μ,Σ)∼N(μ,Σ) \mathbf{P}(x|\mathbf{\mu},\mathbf{\Sigma}) \sim \mathcal{N}(\mathbf{\mu},\mathbf{\Sigma}) μ=[00] Σ=[180018]μ=[00] Σ=[180018] \mathbf{\mu} = \begin{bmatrix} 0 \\ 0 \end{bmatrix} \ \ \ \mathbf{\Sigma} = …

1
lmerモデルに使用する多重比較方法:lsmeansまたはglht?
1つの固定効果(条件)と2つのランダム効果(被験者内のデザインとペアによる参加者)を含む混合効果モデルを使用して、データセットを分析しています。モデルはlme4パッケージで生成されました:exp.model<-lmer(outcome~condition+(1|participant)+(1|pair),data=exp)。 次に、固定効果(条件)のないモデルに対してこのモデルの尤度比検定を実行しましたが、有意差があります。データセットには3つの条件があるため、多重比較を行いたいのですが、どの方法を使用すればよいかわかりません。CrossValidatedや他のフォーラムで同様の質問をいくつか見つけましたが、それでもかなり混乱しています。 私が見たものから、人々は使用することを提案しました 1.lsmeansパッケージ- lsmeans(exp.model,pairwise~condition)私に次のような出力が得られます。 condition lsmean SE df lower.CL upper.CL Condition1 0.6538060 0.03272705 47.98 0.5880030 0.7196089 Condition2 0.7027413 0.03272705 47.98 0.6369384 0.7685443 Condition3 0.7580522 0.03272705 47.98 0.6922493 0.8238552 Confidence level used: 0.95 $contrasts contrast estimate SE df t.ratio p.value Condition1 - Condition2 -0.04893538 0.03813262 62.07 -1.283 0.4099 Condition1 - …

4
最大事後推定が利用可能な場合、MCMCベースの方法は適切ですか?
多くの実際のアプリケーションでは、事後分析が(たとえば、事前確率が共役であったため)MCMCベースの方法を使用してパラメーターを推定することに気づきました。私にとっては、MCMCベースの推定器よりもMAP推定器を使用する方が理にかなっています。MCMCが分析事後の存在下で依然として適切な方法である理由を誰かが指摘できますか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.