ウィキペディアのページ(https://en.wikipedia.org/wiki/Exponential_family)の表記法を使用すると、指数関数ファミリーは、次のように記述できるpmfs / pdfsを持つ確率分布のファミリーです(、はベクトル値):
ここで、は自然パラメータ、は十分な統計であり、はログノーマライザ(ログパーティション関数と呼ばれることもあります)です。理由は対数正規と呼ばれます。これは、継続的なケースでこれが有効なpdfになるためには、
X F θ(X )= H (X )EXP [ η (θ )T T (X )- A (θ )] η (θ )= η T (X )A (θ )A (θ )A (θ )= ログ[ ∫ H (X )EXP [θバツ
fθ(x )= h (x )exp[ η(θ )Tt (x )− A (θ )]
η(θ )= ηt (x )A (θ )A (θ )A (θ )= ログ[ ∫h (x )exp[ η(θ )Tt (x )] dx ]、
および離散的なケースでは、これが有効なpmfになる、
いずれの場合も、と分布の正規化定数であるため、ログ正規化子という名前です。
A (θ )= ログ[ ∑バツh (x )exp[ η(θ )Tt (x )] ]。
∫h (x )exp[ η(θ )Tt (x )] dバツΣバツh (x )exp[ η(θ )Tt (x )]
ここで、softmax関数と次元のカテゴリカル分布の間の特定の関係を確認するには、分布の特定のパラメーター化を使用する必要があります。つまり、をおよび、そしてを定義します()。この分布のpmfは( 1つのホットベクトル、つまり場合はおよびします:
kθ1、⋯ 、θk − 10 < θ1、⋯ 、θk − 1Σk − 1i = 1θ私< 1θk= 1 − ∑k − 1i = 1θ私θ = (θ1、⋯ 、θk)x = (x1、⋯ 、xk)バツ私= 1バツj= 0私≠ j
fθ(x )= ∏i = 1kθバツ私私。
これを指数関数ファミリとして書くには、、、、および、
h (x )= 1η(θ )= (log[ θ1/ θk] 、⋯ 、ログ[ θk − 1/ θk] 、0 )t (x )= (x1、⋯ 、xk)A (θ )= − ログ[ θk]fθ(x )= exp[ (ログ[ θ1/ θk]、⋯ 、ログ[θk− 1/θk] 、0 )T( x1、⋯ 、xk)− ( − ログ[θk] )] 。
今度はと書いて、書けるようにしましょう。次に、ログは
偏導関数取る、我々は見つける
対数正規化関数の勾配が確かにことを明らかにします:
η(θ私)=ログ[ θ私/ θk] = η私θ私= eη私Σkj = 1eηj
A (η)= − ログ[ eηkΣkj = 1eηj] =−ログ[ 1Σkj = 1eηj] =ログ[ ∑j = 1keηj]。
η私∇A(η)=[E η 1∂∂η私A (η)= eη私Σkj = 1eηj、
∇ A (η)= [ eη1Σkj = 1eηj、⋯ 、eηkΣkj = 1eηj]。