LDAトピックモデルアルゴリズムでは、この仮定を見ました。しかし、なぜディリクレ分布を選んだのか分かりませんか?Multinomial上の均一分布をペアとして使用できるかどうかわかりませんか?
LDAトピックモデルアルゴリズムでは、この仮定を見ました。しかし、なぜディリクレ分布を選んだのか分かりませんか?Multinomial上の均一分布をペアとして使用できるかどうかわかりませんか?
回答:
ディリクレ分布がある前共役多項分布のために。これは、多項パラメーターの事前分布がディリクレの場合、事後分布もディリクレ分布であることを意味します(事前パラメーターとはパラメーターが異なります)。これの利点は、(a)事後分布の計算が簡単であり、(b)データを収集した後に信念がどの程度変化したかを何らかの意味で定量化できることです。
これらの基準は実際の事前の信念とは無関係であるため、これらが特定の事前を選択する正当な理由であるかどうかは確かに議論できます...それにもかかわらず、共役事前は人気があります。 。
多項分布の特殊なケースでは、を多項パラメータのベクトル(つまり、異なるカテゴリの確率)とします。場合(P 1、... 、PのK)〜ディリクレ(α 1、··· 、α K)データを収集する前に、その後、観察所与の(X 1、··· 、Xのkは)、異なるカテゴリに (