MCMCとデータ拡張


8

私はMCMCデータ拡張に関する質問を検討してきました。質問の一般的な形式は次のとおりです。

プロセスで収集されたデータがを示唆しており、rateパラメーターの事前として示唆されているとします。データは標準的な形式(つまり、からまでの各値の出現数)で記録および表示されますが、収集されたデータは、X_ {i} \ leq 1(つまりX_ {i} = 0およびX_ {i} = 1のすべてのオカレンスは1つのカテゴリーにグループ化されます)。XiPois(λ)λExp(λ0)Xi0nXi1Xi=0Xi=1

上記のデータ、可能性、事前情報を考慮して、質問では次のことが求められます。

  • 後部形λ

  • X_ {i} = 0である発生回数Xi=0

私はこの質問にどのように答えるかは本当にわかりませんが、ギブスサンプリングがデータ拡張に使用できることを知っています。これをどのように行うことができるかについて誰かが何か情報を持っていますか?

編集:

私はそれが主に2番目の部分(X_ {i} = 0である発生の数Xi=0)であることを確信できません。最初の部分(\ lambdaの後方形式λ)については、可能性と以前の提案が与えられたので、私は推論しました(ただし、修正してよかったのですが)。

与えられた:

π(λ|x)p(x|λ)×p(λ)

したがって、上記のモデルの場合:

π(λ|x)=λi=1nxii=1nxi!enλ×λ0eλλ0

収量の簡素化:

π(λ|x)=λi=1nxii=1nxi!eλ(n+λ0)λ0

これは次のように比例します(したがって、事後形式は次のように与えられます)。

π(λ|x)λi=1nxieλ(n+λ0)λ0

回答:


5

あなたの答えは、0と1に等しい観測値が一緒にマージされるという事実を考慮していません。計算したのは、集約またはマージされたデータではなく、完全なポアソンデータの事後です、。X 1X n(X1,,Xn)(X1,,Xn)

観測がまたは対応し、観測からに対応する場合の規則を採用すると、観測ベクトルの密度は(いくつかの代数と因数分解の後) ここで、はの回数は1です。上記の括弧の間の最後の項は、ポアソンドローで0または1になる確率です。Xi=1Xをiは = 0 X * iは = K > 1 X iは = KをX * 1... X * Nπ λ | X * 1... X * Nα λ Σ N I = 1 x i Ix i > 1Xi=1Xi=0Xi=k>1Xi=k(X1,,Xn) N 1 X * I

π(λ|x1,,xn)λi=1nxiI(xi>1)exp{λ(λ0+n)}×{1+λ}n1
n1xi

したがって、これはあなたの真/観察された事後です。そこから、Gibbsサンプラーを実装できます。

  1. "行方不明の観察"は、所与の生成即ちシミュレート、および観察をで与えられる、 P X I | λ xは* iが = 1 PをX I = 0 | λ xは* iが = 1 = 1 - PX I = 1 | λ xは* iが = 1 = 1λp(xi|λ,xi=1)
    P(xi=0|λ,xi=1)=1P(xi=1|λ,xi=1)=11+λ.
  2. 「完了したデータ」を指定して 生成 します。これは、すでに計算したになります。λ | X 1··· X NGΣ I X I + 1 N + λ 0λ
    λ|x1,,xnG(ixi+1,n+λ0)

(詳細が必要な場合は、George Casellaを含む私のMonte Carlo Statistical Methodsの本の例9.7、p.346でこの設定を正確にカバーしています。)


2
(2)マルコフ連鎖は反復的であるため、任意のMCMCアルゴリズムは任意の値で開始できます。これは、マルコフ連鎖モンテカルロ法の背後にある中心的な考え方です。は事前のパラメーターであることに注意してください。これは事前に選択され、データが観察されると変更されません。λ0
西安

2
(3)ギブスサンプラーのステップ2でガンマ分布からサンプリングする場合、ギブスサンプラーのステップ1で生成された完全なデータを条件とすることに注意してください。したがって、値も、のすべての値を「知っています」。との違いを理解してみてください。これは、データ拡張の原理の背後にある基本的な考え方です。x i = 1 x i x ixixi=1xixi
Xi'an

2
(1)部分は、グループ化された観測値に対応しています。[{λ+1}exp(λ)]n1
西安

2
(2)これは条件付き確率です(自分で計算してみてください):P(xi=0|λ,xi=1)=P(xi=0,xi=1|λ)/P(xi=1|λ)=P(xi=0|λ)/P(xi=1|λ)
西安

2
(3)ギブスサンプリングは条件付きで機能します。したがって、ステップ2では、ステップ1でシミュレーションしたに条件を設定します(ステップ1では、ステップ2でシミュレーションしたを条件にします)。つまり、これらのは既知であり(次の反復で変更されますが)、合計も同様です。この基本的なポイントが不明な場合は、ギブスの紹介を必ず読む必要があります... λ X Ixiλxi
西安
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.