変分推論、KLダイバージェンスには真のが必要


12

変分推論について(非常に控えめに)理解するには、以下を最適化する分布を見つけることにより、未知の分布を近似しようとします。pq

KL(p||q)=xp(x)logp(x)q(x)

変分推論の理解に時間を費やすときはいつでも、私はこの公式に挑戦し続け、私は要点を見逃しているように思わずにはいられません。を計算するためにを知る必要があるようです。しかし、全体の要点は、この分布知らなかったということです。pKL(p||q)p

私が変分を読み込もうとするたびに私を悩ませてきたのはまさにこの点です。何が欠けていますか?

編集

@wijの回答の結果として、ここにいくつかのコメントを追加します。より正確に説明します。

私が興味を持っているケースでは、次のことが当てはまると考えるのは確かに完全に合理的だと思われます。

p(θ|D)=p(D|θ)p(θ)p(D)p(D|θ)p(θ)

この場合、とモデルを選択したので、がどのように比例して見えるかを知ることができました。次に、を推定できるように、家族分布 [ガウシアンと言いましょう] を選択する必要があると言って正しいでしょうか。この場合、正規化されていない近いガウス分布に適合しようとしているように感じます。これは正しいです?p D | θ p θ q K L p θ | D | | q p D | θ p θ pp(D|θ)p(θ)qKL(p(θ|D)||q)p(D|θ)p(θ)

もしそうなら、私の事後は正規分布であると想定しているように感じ、ダイバージェンスに関してこの分布の可能性のある値を見つけようとするだけです。KL

回答:


7

あなたはを完全に未知の物体として扱っているような気がします。これは事実ではないと思います。これはおそらく見逃したものです。p

(iid)を観察し、を推論して、に対しておよびを仮定するとします。はモデルによって指定されます。ベイズの法則により、、P X | Y 、P Y | X P X のx R dはY={yi}i=1np(x|Y)p(y|x)p(x)xRd

p(x|Y)=p(x)p(Y)p(Y|x)=p(x)p(Y)i=1np(yi|x).

最初の観察は、事後分布について何か知っているということです。上記のように与えられます。通常、ノーマライザはわかりません。尤度が非常に複雑な場合、複雑な分布を持つことになります。p Y p y | x p x | Y p(x|Y)p(Y)p(y|x)p(x|Y)

変分推論を可能にする2番目のことは、が取ることができる形式に制約があることです。制約がない場合、はになり、通常は扱いにくくなります。通常、は、指数ファミリーの選択されたサブセットに存在すると想定されます。たとえば、これは完全に因数分解されたガウス分布のファミリである可能性があります。つまり、です。これが制約セットである場合、各コンポーネントは次のように与えられます。qargminqKL(p||q)pqqQ={i=1dqi(xi)each qi is a one-dimensional Gaussian}q

qiexp(Ejiqjlogp(x,Y)),

ここで、正確な式はそれほど重要ではありません。ポイントは、近似のは、真の知識と、近似のがとるべき形式の仮定に依存することによって見つけることができるということです。p(x,Y)=p(x)i=1np(yi|x).qpq

更新

以下は、質問の更新された部分に回答するためのものです。について考えていることに気づきました。私は常に真の量にを使用し、おおよその量にを使用します。変分推論または変分ベイズでは、はKL(q||p(x|Y))pqq

q=argminqQKL(q||p(x|Y)).

上記のように制約がを設定すると、解決策は以前に与えられたものになります。今考えているならQ

q=argminqQKL(p(x|Y)||q),

指数ファミリーのサブセットとして定義された場合、この推論は期待伝播(EP)と呼ばれます。この場合のの解は、そのモーメントがモーメントと一致するようなものです。Qqp(x|Y)

いずれにせよ、あなたは本質的にあなたがKLの意味での真の事後分布を何らかの形を取るように制約された分布によって近似しようとすると言っているのは正しいです。q


私はこれについて議論することはできません。これについては自分自身の光沢も含めて、ほとんどの説明だと思います。
Peadar Coyle
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.