勾配対数正規化器とは何ですか?


回答:


5

ウィキペディアのページ(https://en.wikipedia.org/wiki/Exponential_family)の表記法を使用すると、指数関数ファミリーは、次のように記述できるpmfs / pdfsを持つ確率分布のファミリーです(、はベクトル値): ここで、は自然パラメータ、は十分な統計であり、はログノーマライザ(ログパーティション関数と呼ばれることもあります)です。理由は対数正規と呼ばれます。これは、継続的なケースでこれが有効なpdfになるためには、 X F θX = H X EXP [ η θ T T X - A θ ] η θ = η T X A θ A θ A θ = ログ[ H X EXP [θx

fθ(x)=h(x)exp[η(θ)Tt(x)A(θ)]
η(θ)=ηt(x)A(θ)A(θ)
A(θ)=log[h(x)exp[η(θ)Tt(x)]dx],
および離散的なケースでは、これが有効なpmfになる、 いずれの場合も、と分布の正規化定数であるため、ログ正規化子という名前です。
A(θ)=log[xh(x)exp[η(θ)Tt(x)]].
h(x)exp[η(θ)Tt(x)]dxxh(x)exp[η(θ)Tt(x)]

ここで、softmax関数と次元のカテゴリカル分布の間の特定の関係を確認するには、分布の特定のパラメーター化を使用する必要があります。つまり、をおよび、そしてを定義します()。この分布のpmfは( 1つのホットベクトル、つまり場合はおよびします: kθ1,,θk10<θ1,,θk1i=1k1θi<1θk=1i=1k1θiθ=(θ1,,θk)x=(x1,,xk)xi=1xj=0ij

fθ(x)=i=1kθixi.
これを指数関数ファミリとして書くには、、、、および、 h(x)=1η(θ)=(log[θ1/θk],,log[θk1/θk],0)t(x)=(x1,,xk)A(θ)=log[θk]
fθ(x)=exp[(log[θ1/θk],,log[θk1/θk],0)T(x1,,xk)(log[θk])].

今度はと書いて、書けるようにしましょう。次に、ログは 偏導関数取る、我々は見つける 対数正規化関数の勾配が確かにことを明らかにします: η(θi)=log[θi/θk]=ηiθi=eηij=1keηj

A(η)=log[eηkj=1keηj]=log[1j=1keηj]=log[j=1keηj].
ηiAη=[E η 1
ηiA(η)=eηij=1keηj,
A(η)=[eη1j=1keηj,,eηkj=1keηj].

ワオ!!それは素晴らしい説明であり、全く理にかなっています。ありがとうございました:)
tashuhka 2018年

私はこの派生物を長い間探していました!どういう状況でこの知識を発展させなければならなかったのでしょうか。これをコースや教科書の一部として見ましたか?私はインターネットでこの関係への言及を探し続けましたが、実際に詳細を誰も示していません。
zipzapboing

1
@zipzapboing OPの質問を見るまで、私は実際にこのソフトマックスの特性を知りませんでした!しかし、私はカゼッラとバーガーレベルの統計コース(指数ファミリとその他のプロパティのいくつかが紹介されています)を私のベルトの下に持っていました。
18
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.