タグ付けされた質問 「bayesian」

ベイズ推定は、モデルパラメータを確率変数として扱い、ベイズの定理を適用して、観測されたデータセットを条件とするパラメータまたは仮説に関する主観的な確率ステートメントを推定することに依存する統計的推定の方法です。

2
コインフリッピング、意思決定プロセス、および情報の価値
次のセットアップを想像してください。2つのコインがあります。コインAは公平であることが保証され、コインBは公平である場合とそうでない場合があります。100コインフリップを行うように求められます。目的は、ヘッドの数を最大にすることです。 コインBについての事前情報は、コインBが3回裏返され、1つのヘッドが得られたことです。決定ルールが、2枚のコインの頭の予想確率を比較することに単に基づいている場合、コインAを100回裏返し、それで完了します。これは、コインBがより多くの頭を生み出すと信じる理由がないため、確率の合理的なベイズ推定(事後平均)を使用する場合でも当てはまります。 しかし、コインBが実際に頭に有利にバイアスされている場合はどうなりますか?確かに、コインBを数回ひっくり返して(したがって、その統計的特性に関する情報を取得して)あきらめる「潜在的な頭」は、ある意味で価値があり、したがって、決定に影響を与えます。この「情報の価値」を数学的にどのように説明できますか? 質問:このシナリオで、最適な決定ルールを数学的にどのように構築しますか?

1
REMLにはベイジアン解釈が存在しますか?
REMLのベイジアン解釈は利用可能ですか?私の直感では、REMLはいわゆる経験的ベイズ推定手順に非常に似ており、ある種の漸近的等価性(たとえば、適切な事前クラスのもとで)が実証されているのだろうかと思います。経験的ベイズとREMLはどちらも、たとえば迷惑なパラメーターに直面して行われた「妥協した」推定アプローチのように見えます。 主に、この質問で私が求めるのは、こうした種類の議論がもたらす傾向がある高レベルの洞察です。もちろん、何らかの理由でこの性質の議論をREMLで有効に追求できない場合、これがなぜそうなのかについての説明も歓迎すべき洞察を提供するでしょう!

1
ベイジアン投げ縄vsスパイクとスラブ
質問:変数選択に一方を他方よりも優先的に使用することの利点/欠点は何ですか? :私は可能性があると Iを置くことができるいずれかの事前確率のいずれかを: wはI〜π δ 0 + (1 - π )N(0 、100 )y〜N(Xw 、σ2私)y〜N(バツw、σ2私)y\sim\mathcal{N}(Xw,\sigma^2I) または: W I〜EXP (- λ | W I |)w私〜πδ0+ (1 - π)N(0 、100 )π= 0.9、w私〜πδ0+(1−π)N(0、100)π=0.9、 w_i\sim \pi\delta_0+(1-\pi)\mathcal{N}(0,100)\\ \pi=0.9\,, w私〜EXP(- λ | ワット私| )λ 〜Γ (1 、1 )。w私〜exp⁡(−λ|w私|)λ〜Γ(1、1)。 w_i\sim \exp(-\lambda|w_i|)\\ \lambda \sim \Gamma(1,1)\,. π= 0.9π=0.9\pi=0.9λλ\lambda しかし、私の教授は、なげなわバージョンが係数を「縮小」し、実際に適切な変数選択を行っていない、つまり関連するパラメーターでさえ過剰に縮小していると主張し続けています。 個人的には、バリエーションベイズを使用しているため、Lassoバージョンの実装が簡単になっています。実際、事前分布を効果的に配置するスパースベイジアン学習ペーパー1| …

2
Naive Bayesは連続変数をどのように処理しますか?
私の(非常に基本的な)理解では、Naive Bayesはトレーニングデータの各特徴のクラス頻度に基づいて確率を推定します。しかし、連続変数の頻度をどのように計算するのでしょうか?また、予測を行う場合、トレーニングセットのどの観測値とも同じ値でない可能性がある新しい観測値をどのように分類しますか?ある種の距離測定を使用していますか、それとも1NNを見つけていますか?

4
最大事後推定が利用可能な場合、MCMCベースの方法は適切ですか?
多くの実際のアプリケーションでは、事後分析が(たとえば、事前確率が共役であったため)MCMCベースの方法を使用してパラメーターを推定することに気づきました。私にとっては、MCMCベースの推定器よりもMAP推定器を使用する方が理にかなっています。MCMCが分析事後の存在下で依然として適切な方法である理由を誰かが指摘できますか?

2
ベイジアンディープラーニングとは何ですか?
ベイジアンディープラーニングとは何ですか?また、従来のベイジアン統計および従来のディープラーニングとどのように関連していますか? 関係する主な概念と数学は何ですか?それは単なるノンパラメトリックベイジアン統計と言えますか?現在の主要な開発およびアプリケーションと同様に、その独創的な作品は何ですか? PS:Bayesian Deep Learningは大きな注目を集めています。NIPSワークショップをご覧ください。

3
ハイパーパラメーターチューニング:ランダム検索とベイジアン最適化
したがって、ランダム検索はグリッド検索よりも優れていることがわかっていますが、最近のアプローチはベイズ最適化(ガウスプロセスを使用)です。私は2つの比較を調べましたが、何も見つかりませんでした。スタンフォード大学のcs231nでは、ランダム検索のみに言及していることは知っていますが、物事をシンプルにしたい可能性があります。 私の質問は次のとおりです。一般的にどちらのアプローチの方が優れていますか。答えが「ランダム検索、時にはベイジアン」である場合、あるメソッドを別のメソッドよりも優先させるべきですか

3
MCMCの実行:jags / stanを使用するか、自分で実装する
ベイジアン統計の研究は初めてです。ベイジアンの研究者はJAGS / Stanのようなツールを使用するよりも、MCMCを自分で実装する方がよいと研究者から聞いた。学習目的を除いて、MCMCアルゴリズムを(Rのような「高速ではない」言語で)自分で実装することの利点は何ですか?
13 bayesian  mcmc 

2
頻繁な結果からベイジアンを事前にする
頻繁な結果をベイジアン事前に変換するにはどうすればよいですか? 次はかなり一般的なシナリオを考えてみましょう:実験は、過去に行われた、いくつかのパラメータの結果測定しました。分析は、頻繁な方法論で行われました。ϕの信頼区間が結果に示されています。ϕϕ\phiϕϕ\phi 私は今、私は、いくつかの他のパラメータを測定し、両方の言いたいいくつかの新しい実験行ってるとφを。私の実験は以前の研究とは異なります---それは同じ方法論では実行されません。私は、ベイジアン解析を行いたい、と私は上の場所の事前分布にする必要がありますθとφ。θθ\thetaϕϕ\phiθθ\thetaϕϕ\phi 以前の測定は実行されていないので、情報のない(たとえばその均一な)をその前に配置します。 θθ\theta 上述したように、のために前の結果がある信頼区間として与えられるが、。現在の分析でその結果を使用するには、分析の前に、以前の頻度の高い結果を有益な情報に変換する必要があります。 ϕϕ\phi この構成されたシナリオでは利用できない1つのオプションは、ベイジアン方式で測定に至る前の分析を繰り返すことです。 私はこれを行うことができれば、φは、私はその後、私の前として使用することを前の実験から後部を持っているでしょうし、何の問題もないでしょう。ϕϕ\phi ϕϕ\phi 分析のために、頻度の高いCIをベイジアン事前分布に変換するにはどうすればよいですか?換言すれば、どのように私は彼らにfrequentest結果を翻訳でき上の後部にφ私はその後、私の分析では前のように使用すること?ϕϕ\phiϕϕ\phi この種の問題について議論する洞察や参考文献は歓迎します。

1
メタ分析での効果サイズの事前指定
私の質問は、エフェクトサイズの事前分布に関するものです。私のプロジェクトでは、尺度はCohenのです。文献を読むことで、よく知られている8つの学校の階層的なベイジアンメタ分析の例のように、あいまいな事前定義がよく使用されるようです。8校の例では、私のような、ムーの推定に使用漠然と前を見てきました μ θ〜ノーマル(0 、100 )。DDDμθ〜正常(0 、100 )μθ〜正常⁡(0、100)\mu_{\theta} \sim \operatorname{normal}(0, 100) 私の専門分野は心理学で、通常、効果のサイズは小さいです。そのため、私はこの前を使用して検討していた:。前、このような厳しいための私の根拠は、事前分布の私の理解から、私はことを95%の事前確率置いています、つまりμ θが間-1 1に、その-1または1大きい影響については5%事前確率を残しているし。μθ〜正常( 0 、.5 )μθ〜正常⁡(0、.5)\mu_{\theta} \sim \operatorname{normal}(0, .5)μθμθ\mu_{\theta} 効果がこれほど大きいことはめったにありませんが、これは正当なものですか?

1
複数の条件を持つベイズ定理
この方程式がどのように導き出されたのか理解できません。 P(I|M1∩M2)≤P(I)P(I′)⋅P(M1|I)P(M2|I)P(M1|I′)P(M2|I′)P(I|M1∩M2)≤P(I)P(I′)⋅P(M1|I)P(M2|I)P(M1|I′)P(M2|I′)P(I|M_{1}\cap M_{2}) \leq \frac{P(I)}{P(I')}\cdot \frac{P(M_{1}|I)P(M_{2}|I)}{P(M_{1}|I')P(M_{2}|I')} この方程式は、OJ Simpsonの事例が問題例として与えられた論文「Trial by Probability」からのものでした。被告は二重殺人の裁判を受けており、2つの証拠が彼に対して導入されています。 M1M1M_{1}は、被告の血液が犯罪現場で見つかった一滴の血液と一致するイベントです。M2M2M_{2}は、被害者の血液が被告に属する靴下の血液と一致するイベントです。罪悪感を仮定すると、1つの証拠が発生すると、他の証拠の確率が高くなります。 III一方で被告が無実であるイベントでI′I′I'彼が有罪であるときです。 私たちは、2つの証拠を与えられた被告が無実である確率の上限を取得しようとしています。 いくつかの変数の値が与えられましたが、私が興味を持っているのは方程式がどのように導出されたかです。試しましたが、どこにも行きませんでした。 はい、私はすでに「すでに答えがあるかもしれない質問」をチェックしました。

1
パラメーターと潜在変数
私はこれについて以前に尋ねましたが、何がモデルパラメータを作り、何が潜在変数を作るのかを特定することに本当に苦労してきました。このサイトのこのトピックに関するさまざまなスレッドを見ると、主な違いは次のように思われます。 潜在変数は観察されませんが、変数であり、パラメータも観察されず、それらに関連する分布がないため、関連する確率分布があります。これらは定数であり、固定しようとしている未知の値を持っていると理解しています見つける。また、パラメーターに関連付けられた真の値が1つだけであるか、少なくともそれが想定されている場合でも、これらのパラメーターに関する不確実性を表すためにパラメーターに事前分布を置くことができます。私はこれまでのところ正しいと思いますか? 今、私はジャーナル論文からベイジアン加重線形回帰のこの例を見ており、パラメーターと変数とは何かを理解するのに本当に苦労しています: y私= βTバツ私+ ϵy私y私=βTバツ私+ϵy私 y_i = \beta^T x_i + \epsilon_{y_i} ここでは、とyが観察されますが、yのみが変数として扱われます。つまり、それに関連付けられた分布があります。バツバツxyyyyyy 現在、モデリングの前提は次のとおりです。 y〜N(βTバツ私、σ2/ w私)y〜N(βTバツ私、σ2/w私) y \sim N(\beta^Tx_i, \sigma^2/w_i) したがって、の分散は重み付けされます。yyy また、およびwには事前分布があり、それぞれ正規分布とガンマ分布です。 ββ\betawww したがって、完全な対数尤度は次のように与えられます。 ログp (y、w 、β| X)=ΣログP(y私| w、β、x私)+ ログP(β)+ Σ ログP(w私)ログ⁡p(y、w、β|バツ)=Σログ⁡P(y私|w、β、バツ私)+ログ⁡P(β)+Σログ⁡P(w私) \log p(y, w, \beta |x) = \Sigma \log P(y_i|w, \beta, x_i) + \log P(\beta) + \Sigma \log P(w_i) …


1
ハミルトニアンモンテカルロおよび離散パラメーター空間
私はちょうどスタンでモデルの構築を始めました。このツールに慣れるために、私はベイジアンデータ分析(第2版)のいくつかの演習を行っています。ウォーターバック運動想定し、そのデータと、(N 、θ )は不明。ハミルトニアンモンテカルロは離散パラメーターを許可しないため、Nを実ε [ 72 、∞ )として宣言し、関数を使用して実数値の二項分布をコード化しました。n∼binomial(N,θ)n∼binomial(N,θ)n \sim \text{binomial}(N, \theta)(N,θ)(N,θ)(N, \theta)NNN∈[72,∞)∈[72,∞)\in [72, \infty)lbeta 結果のヒストグラムは、事後密度を直接計算して見つけたものとほぼ同じに見えます。ただし、これらの結果を一般的に信頼してはいけない微妙な理由があるのではないかと心配しています。の実数値推論は非整数値に正の確率を割り当てるため、実際には分数ウォーターバックは存在しないため、これらの値は不可能であることがわかります。一方、結果は良好であるように見えるため、この場合、単純化は推論に影響を与えないように見えます。NNN この方法でモデリングするための指針や経験則はありますか?それとも、個別のパラメーターを実際の悪い慣行に「促進」するこの方法はありますか?


弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.