ディリクレ後部


11

ディリクレ事後分布について質問があります。多項尤度関数が与えられた場合、事後はであることが知られています。ここで、は観測値を表示した回数です。Dir(αi+Ni)Niith

与えられた固定データに対して s を減らし始めるとどうなりますか?後部の形から、ある時点で sは後部にまったく影響を与えなくなるようです。しかし、 sを非常に小さくすると、質量がシンプレックスのコーナーに移動し、後方に大きな影響が及ぶ可能性があると言うのは正しいのではないでしょうか。どのステートメントが正しいですか?αDαα

回答:


6

私にとってディリクレのパラメータの効果を想像するのに最も役立つ方法は、ポリアの壷です。urnにn個の異なる色が含まれていて、urn に各色のがあるとします(ボールの端数を持つことができることに注意してください)。手を伸ばしてボールを描き、同じ色の別のボールと入れ替えます。次に、これを無限の回数繰り返すと、最終的な比率がディリクレ分布のサンプルになります。値が非常に小さい場合、追加されたボールが最初のドローのカラーに向かって大きく重み付けされることは明らかです。これは、質量がシンプレックスのコーナーに移動する理由を説明しています。が大きい場合、最初の描画は最終的な比率にそれほど影響しません。αiααs

あなたの事後が本質的に言っていることは、あなたは色ボールから始めて、たくさんのドローを行い、そしてその色を回引き出したこと です。次に、同じプロセスで生成される事後からのサンプルを想像し、がそれらのサンプルに及ぼすカウントとともに、初期の効果を想像できます。明らかに値が小さいと、後方への影響が少なくなります。αiiNiαNα

それについて考えるもう1つの方法は、ディリクレへのパラメーターがデータの信頼度を制御することです。値が小さい場合は、データをほぼ完全に信頼しています。逆に、値が大きい場合、データに対する信頼性が低くなり、事後を少し滑らかにします。αα

まとめると、を小さくすると後方への影響は少なくなりますが、同時に、事前分布の質量のほとんどがシンプレックスのコーナーにあると言うのは正しいことです。αs

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.