フィッシャーメトリックと相対エントロピーの関係


20

誰かがフィッシャー情報メトリックと相対エントロピー(またはKL発散)の間の次の関係を純粋に数学的な厳密な方法で証明できますか?

D(p(,a+da)p(,a))=12gi,jdaidaj+(O(da3)
ここでa=(a1,,an),da=(da1,,dan)
gi,j=i(logp(x;a))j(logp(x;a)) p(x;a) dx
gi,jdaidaj:=i,jgi,jdaidaj(x; a)〜dxおよびg_ {i、j} \、da ^ i \、da ^ j:= \ sum_ {i、j} g_ {i、j} \、da ^ i \、da ^ jはアインシュタインの総和規則です。

上記のことは、John Baezの素敵なブログで見つけました。VasileiosAnagnostopoulosがコメントでそれについて述べています。


1
親愛なるクマラ:明確にするために、あなたの記法、特にg_ {i、j}の意味をより良く説明するのに役立つでしょうgi,j。また、表示式の右辺の最初の項の前に定数の1/2の式が欠けていると思います1/2。Kullback自身が発散と呼んだもの(表記J(,))は、KL発散と呼ばれる既知のものの対称バージョンであることに注意してください。つまり、J(p,q)=D(pq)+D(qp)。KLの発散は、カルバックの著作ではI(\ cdot、\ cdot)と示さI(,)れていました。これは1/2の係数も説明して1/2います。乾杯。
枢機

回答:


19

1946年、地球物理学者およびベイジアン統計学者ハロルドジェフリーズは、今日カルバックライブラー発散と呼ぶものを導入し、「無限に近い」2つの分布について(Math SEの人がこれを見ないことを期待しましょう;-)それらの係数がフィッシャー情報行列の要素によって与えられる二次形式としてのカルバック・ライブラー発散。彼はこの二次形式をリーマン多様体の長さの要素として解釈し、フィッシャー情報がリーマン計量の役割を果たしました。統計モデルのこの幾何学化から、彼は、リーマン計量によって自然に誘導される尺度としてジェフリーズの事前分布を導き出しました。この尺度は、一般に有限尺度ではありませんが、多様体上の本質的に均一な分布として解釈できます。

厳密な証明を書くには、すべての規則性条件を見つけ出し、テイラー展開の誤差項の順序に注意する必要があります。これは、議論の簡単なスケッチです。

2つの密度と間の対称化されたKullback-Leibler発散は、次のように定義されます。fg

D[f,g]=(f(x)g(x))log(f(x)g(x))dx.

でパラメーター化された密度のファミリーがある場合、θ=(θ1,,θk)

D[pθpθ+θ]=pバツθpバツθ+θログpバツθpバツθ+θdバツ
Δ θ = Δがθ 1... Δ θ K、Δ P X | θ = P X | θ - P X | θ + Δ θ 中。表記の導入 いくつかの簡単な代数は 自然対数にテイラー展開を使用すると、 θ=θ1θk
pバツθ=pバツθpバツθ+θ
D[pθpθ+θ]=pバツθpバツθログ1+pバツθpバツθpバツθdバツ
ログ1+pバツθpバツθpバツθpバツθ
D [ p したがって ただし、 したがって、 ここで
D[pθpθ+θ]pバツθpバツθ2pバツθdバツ
pバツθpバツθ1pバツθ=1kpバツθθθ==1kログpバツθθθ
D[pθpθ+θ]j=1kgjθθj
gj=ログpバツθθログpバツθθjpバツθdバツ

これは元の論文です。

ジェフリーズ、H。(1946)。推定問題における事前確率の不変式。手続き 王立協会 ロンドン、シリーズA、186、453–461。


1
素敵な文章をありがとうございました。あなたもこれを助けることができればいいでしょう。
くまら

はい、あなたは正しく言った。この「抽象化のtrap」から抜け出さなければなりません。
くまら

@zen積分の下で対数のテイラー展開を使用していますが、なぜそれが有効ですか?
Sus20200

1
標準のKL発散とは対照的に、対称化されたKL発散から開始することが重要と思われます。ウィキペディアの記事では、対称化されたバージョンについては言及されていないため、間違っている可能性があります。en.wikipedia.org/wiki/Kullback%E2%80%93Leibler_divergence
外科司令官

11

通常の(非対称)KL発散の証明

Zenの答えは対称化されたKL発散を使用しますが、結果は無限に近い分布に対して対称になるため、通常の形式にも当てはまります。

これはスカラーパラメーター化された離散分布の証明です(私は怠け者だからです)が、連続分布またはパラメーターのベクトル用に簡単に書き換えることができます。θ

Dpθpθ+dθ=pθログpθpθログpθ+dθ 
最終項のテイラー展開: いくつかの規則性を仮定して、2つの結果を使用しました。
=pθログpθpθログpθ= 0dθpθddθログpθ= 0 12dθ2pθd2dθ2ログpθ=pθddθログpθ2 +Odθ3=12dθ2pθddθログpθ2フィッシャー情報+Odθ3
pθddθログpθ=ddθpθ=ddθpθ=0

pθd2dθ2ログpθ=pθddθ1pθdpθdθ=pθ[1pθd2pθdθ1pθdpθdθ2]=d2pθdθ2pθ1pθdpθdθ2=d2dθ2pθ= 0pθddθログpθ2

4

次の論文の式(3)で同様の関係(1次元パラメーター)を見つけることができます。

D.グオ(2009)、相対エントロピーおよびスコア関数:任意の加法摂動による新しい情報と推定の関係Proc。情報理論に関するIEEE国際シンポジウム、814〜818。(安定したリンク)。

著者は

S.カルバック、情報理論と統計学。ニューヨーク:ドーバー、1968。

この結果の証拠のために。


1
その論文の方程式(3)の多変量バージョンは、27〜28ページの引用されたカルバックテキストで証明されています。定数は、OPの質問で欠落しているようです。:)1/2
枢機
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.