ハミルトニアンモンテカルロおよび離散パラメーター空間


13

私はちょうどスタンでモデルの構築を始めました。このツールに慣れるために、私はベイジアンデータ分析(第2版)のいくつかの演習を行っています。ウォーターバック運動想定し、そのデータと、N θ は不明。ハミルトニアンモンテカルロは離散パラメーターを許可しないため、Nを実ε [ 72 として宣言し、関数を使用して実数値の二項分布をコード化しました。nbinomial(N,θ)(N,θ)N[72,)lbeta

結果のヒストグラムは、事後密度を直接計算して見つけたものとほぼ同じに見えます。ただし、これらの結果を一般的に信頼してはいけない微妙な理由があるのではないかと心配しています。の実数値推論は非整数値に正の確率を割り当てるため、実際には分数ウォーターバックは存在しないため、これらの値は不可能であることがわかります。一方、結果は良好であるように見えるため、この場合、単純化は推論に影響を与えないように見えます。N

この方法でモデリングするための指針や経験則はありますか?それとも、個別のパラメーターを実際の悪い慣行に「促進」するこの方法はありますか?


3
N72NθN

θ^

回答:


18

まず、ユーザーのリスト(http://mc-stan.org/mailing-lists.html)でこのような質問を気軽に行ってください。ここでは、Stanの実装/最適化などに関連する問題だけでなく、実用的な統計およびモデリングの質問。

あなたの質問に関して、それは絶対に素晴らしいアプローチです。それをより厳密に正当化する方法は多数ありますが(たとえば、離散CDFとその連続近似との間の相違を見ること)、基本的に分散が数倍よりも大きい限り、欠落している離散化には実際には何もありません後続の推論への影響。

この種の近似は遍在的であり、一般的な例は、ガウス分布として近似される独立ポアソン分布の積としての多項分布の近似です。


9
その瞬間とき、一年後、あなたがいることを実感マイケル・ベタンコートは、あなたの質問への答えを投稿...
Sycoraxは回復モニカ語ります
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.