パターン認識と機械学習(Bishop、2007)の第10章に従って、多変量ガウス分布のバニラ変分混合を実装しています。
ベイジアン手法では、事前にガウス逆ウィシャートの(ハイパー)パラメーターを指定する必要があります。
- (事前のディリクレ濃度パラメーター);
- (逆ウィシャート分布の自由度);
- (ガウス逆Wishart分布の疑似観測);
- (ガウス分布の平均)。
- (逆ウィシャートのスケール行列)。
一般的な選択肢は 、 、 、 、 、 どこ 空間の次元です。
当然のことながら、事後はパラメータの選択に強く依存する可能性があります(特に、 コンポーネントの数に大きな影響を与えます。 )。ために そして 、上記の選択は、データがある程度正規化されている場合にのみ意味があります。
一種の経験的なベイズアプローチに従って、私は設定を考えていました そして データの経験的平均および経験的共分散行列に等しい(後者の場合、おそらく対角線のみを考慮することができます。また、サンプルの共分散行列を乗算する必要があります )。これは賢明でしょうか?パラメータを設定する他の合理的な方法について何か提案はありますか?(完全に階層的なベイズとDPGMMを使用せずに)
(ここにも同様の質問がありますが、私の質問に関連する回答はありません。)