あなたはを完全に未知の物体として扱っているような気がします。これは事実ではないと思います。これはおそらく見逃したものです。p
(iid)を観察し、を推論して、に対しておよびを仮定するとします。はモデルによって指定されます。ベイズの法則により、、P (X | Y )、P (Y | X )P (X )のx ∈ R dはY={yi}ni=1p(x|Y)p(y|x)p(x)x∈Rd
p(x|Y)=p(x)p(Y)p(Y|x)=p(x)p(Y)∏i=1np(yi|x).
最初の観察は、事後分布について何か知っているということです。上記のように与えられます。通常、ノーマライザはわかりません。尤度が非常に複雑な場合、複雑な分布を持つことになります。p (Y )p (y | x )p (x | Y )p(x|Y)p(Y)p(y|x)p(x|Y)
変分推論を可能にする2番目のことは、が取ることができる形式に制約があることです。制約がない場合、はになり、通常は扱いにくくなります。通常、は、指数ファミリーの選択されたサブセットに存在すると想定されます。たとえば、これは完全に因数分解されたガウス分布のファミリである可能性があります。つまり、です。これが制約セットである場合、各コンポーネントは次のように与えられます。qargminqKL(p||q)pqq∈Q={∏di=1qi(xi)∣each qi is a one-dimensional Gaussian}q
qi∝exp(E∏j≠iqjlogp(x,Y)),
ここで、正確な式はそれほど重要ではありません。ポイントは、近似のは、真の知識と、近似のがとるべき形式の仮定に依存することによって見つけることができるということです。p(x,Y)=p(x)∏ni=1p(yi|x).qpq
更新
以下は、質問の更新された部分に回答するためのものです。について考えていることに気づきました。私は常に真の量にを使用し、おおよその量にを使用します。変分推論または変分ベイズでは、はKL(q||p(x|Y))pqq
q=argminq∈QKL(q||p(x|Y)).
上記のように制約がを設定すると、解決策は以前に与えられたものになります。今考えているならQ
q=argminq∈QKL(p(x|Y)||q),
指数ファミリーのサブセットとして定義された場合、この推論は期待伝播(EP)と呼ばれます。この場合のの解は、そのモーメントがモーメントと一致するようなものです。Qqp(x|Y)
いずれにせよ、あなたは本質的にあなたがKLの意味での真の事後分布を何らかの形を取るように制約された分布によって近似しようとすると言っているのは正しいです。q