現在、確率的PCAに関する論文を読んでいますが、潜在変数にガウスの事前(他の事前ではなく)が選ばれるのはなぜですか?それは単純な理由だけですか、それとも別の理由がありますか?
参照:
- Tipping&Bishop、1999年、確率論的主成分分析 -eq。(2)
- Tipping&Bishop、1999、Mixtures of Probabilistic Principal Component Analyzers -eq。(4)
現在、確率的PCAに関する論文を読んでいますが、潜在変数にガウスの事前(他の事前ではなく)が選ばれるのはなぜですか?それは単純な理由だけですか、それとも別の理由がありますか?
参照:
回答:
確率的PCAは、次の形式のガウス潜在変数モデルです。観測は変数で構成され、潜在変数は変数で構成されると想定されます。潜在的なオーバーオーバー変数はゼロ平均単位共分散ガウス:あり、潜在変数が与えられた場合の観測変数の条件付き分布は このモデルの最尤解は、データの最初の PCAコンポーネントによって与えられることがわかります。 D Z ∈ R M M < DのZ〜N(0、I)、
前(または少なくとも大部分の他の事前確率のために)他のための最尤解があろうない標準のPCA溶液に対応するので、「確率的PCA」この潜在変数モデルを呼び出す理由はないだろう。ガウスは、PCAを引き起こすものです。
他のほとんどの事前計算では、問題がはるかに複雑になり、分析的にも扱いにくくなります。ガウス事前分布とガウス条件付き分布があると、ガウス周辺分布になり、その共分散行列はによって与えられることが簡単にわかります。非ガウス分布は、操作がはるかに困難です。W ⊤ W + σ 2 I
標準PCAのタスクは共分散行列(つまり、2次モーメント)をモデル化することなので、ガウス周辺分布があることも魅力的です。PCAは、データ配信のより高い瞬間には関心がありません。ガウス分布は、平均と共分散の最初の2つのモーメントによって完全に記述されます。PCAはデータのこれらの側面を処理しないため、より複雑で柔軟な分布を使用したくありません。
ガウスの事前分布には単位共分散行列があります。これは、ローディングによってのみ観測された共分散を引き起こす無相関の潜在変数を持つことになるためです。