多変量ガウス対数尤度の勾配


8

勾配降下法でモデルのMAP推定値を見つけようとしています。私の以前は、既知の共分散行列をもつ多変量ガウスです。

概念的なレベルでは、私はこれを行う方法を知っていると思いますが、詳細についていくつかの助けを求めていました。特に、問題に対処する簡単な方法がある場合、それは特に役立ちます。

ここでは、私が何だと思う私は実行する必要があります。

  • 各次元について、他の次元での現在の位置を指定して、条件付き分布を見つけます。
  • これにより、正しい平均と標準偏差を使用して、各次元の局所的な一変量ガウス分布が得られます。
  • 勾配は、これらの単変量分布のそれぞれの導関数のベクトルである必要があると思います。

私の質問には2つの部分があります。

  1. これは最善のアプローチですか、それとももっと簡単な方法がありますか?
  2. このルートに行く必要があると仮定すると、これらの条件付き分布を見つけるための最良の方法は何ですか?

勾配降下法でこれを実行する理由はありますか?かなりよく研究された問題のように、いくつかの以前の音でMVNのMAPを見つけること。MVNは自己共役なので、完全なベイジアンアプローチも可能です。
bayerj 2014年

@bayerjいい質問です。以前はMVNですが、可能性はそうではありません。それは私の選択肢を制限すると思います。
David J. Harris

ああ、わかりませんでした。
bayerj 2014年

回答:


8

最適化はどうですか?

p(y|x,θ)xθp(θ)L=p(y|x,θ)p(θ)θN(μ,Σ)。あなたはこの問題のMAPソリューションを見つけたい、すなわち この問題の特別なケースは、ニューラルネットワークコミュニティでよく研究されており、重みの減衰として知られています。その場合には、μ = 0Σは= 私はσ 2を

argmaxθL.
μ=0Σ=Iσ2

すでに述べたように、トリックはそれで。ガウス密度の対数を取ると、多くの醜い項(指数)が消え、log p θ = 1のようなsthになります。argmaxθL=argmaxθlogLlogp(θ)=12(θμ)TΣ1(θμ)+const

12(θμ)TΣ1(θμ)θ=Σ1(θμ).

(確認してください。これはすぐに私の頭の中で行われました。)モデルの派生物と共に、既製のオプティマイザーを使用してMAPソリューションにたどり着くことができます。

更新:David J. Harrisによるコメントが組み込まれました。数式は正しいはずです。


(+1)これはまさに私が必要としているもののように見えます。今日の午後、少し検証を行い、問題がなければ「承認」チェックマークを付けます。ありがとうございました!
David J. Harris

θ

1/2

はい、そうです。忘れちゃった!
bayerj 2014年

1
カスタムの多変量ガウス事前分布(非対角共分散行列を使用)は、ティホノフ正則化を
Artem Sobolev

0

可能性がガウスでない場合、分析結果があるかどうかを判断することはできません。また、2番目の箇条書きは一般に正しくありません。ガウス事前確率と一般尤度は、ベクトルコンポーネントの条件付きガウス分布を考慮していないためです。

MAPを取得する1つの方法は、MCMCを使用して完全なベイズ分析を行い、事後からのサンプルを使用して推定することです。[この場合、MAPだけを使用するよりも優れた情報が得られます。]興味がわからない-とにかく、このルートを下ってみませんか?

別のアプローチを行うこともできます(これが一般的に行われるのを見たことがないので、誰かがそれが問題である場合は修正してください):

p(θ|x)=p(x|θ)p(θ)p(x)

l(θ|x)=l(x|θ)+l(θ)l(x)

dl(θ|x)dθ=dl(x|θ)dθ+dl(θ)dθ=0

θ


ご入力いただきありがとうございます。私ははっきりしていなかったかもしれません:現在、私は以前の勾配を見つけることに興味があります。対数事後の勾配は、対数尤度の勾配と対数事前分布の勾配の合計に過ぎないため、これら2つの勾配を別々に検出しても問題ありません。
デビッドJ.ハリス

1
θ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.