確率的正準相関分析(確率的CCA、PCCA)は、Bach&Jordan、2005、A Probabilistic Interpretation of Canonical Correlation Analysisで導入されました。
簡単に言うと、次の確率モデルに基づいています。
zx|zy|z∼N(0,I)∼N(Wxz+μx,Ψx)∼N(Wyz+μy,Ψy)
ここで、ノイズ共分散およびは、任意のフルランク対称行列です。ΨxΨy
1次元の潜在変数を考慮する場合、すべての平均がゼロであると想定し、とし、とを1つのベクトルに結合すると、次のようになります。zμx=μy=0xy
(xy)∼N(0,Σ),Σ=(wxw⊤x+Ψxwyw⊤xwxw⊤ywyw⊤y+Ψy).
Bach&Jordanは、これが標準のCCAと同等であることを証明しました。具体的には、最尤(ML)解は与えられますここで、は両方のデータセットのサンプル共分散行列、は軸の最初の正準ペア、は任意です製品としての最初の正準相関を与える数値(両方ともと間)。
wi=Σiuimi,
Σiuimxmy=ρ101
ご覧のように、はCCA軸と直接同じではありませんが、それらのいくつかの変換によって与えられます。詳細については、バッハとジョーダンを参照してください。wi
PCCAを直感的によく理解していません。あなたが見ることができるように、間の相互共分散行列とによってモデル化された 1は、単純に期待することができるように、にかなりPLS軸をもたらします。ただし、MLソリューションはCCA軸に関連しています。のブロック対角構造が原因と思われます。XYwxw⊤ywiΨ=(Ψx00Ψy)
私は、RRRまたはPLSの同様の確率的バージョンを認識していないため、自分で考え出すことができませんでした。が対角線の場合、結合されたデータセットでFAを取得し、対角線で等方性の場合、結合されたデータセットでPPCAを取得することに注意してください。したがって、がますます制約されるにつれて、CCAからFAからPPCAへの進行があります。他のどの選択肢が妥当であるかわかりません。ΨX+YΨΨ