KLは、フィッシャーメトリックテンソル内の多様体として一連の歯を視覚化するときに深い意味を持ち、2つの「近い」分布間の測地線距離を与えます。正式に:
ds2=2KL(p(x,θ),p(x,θ+dθ))
次の行は、この数式の意味を詳細に説明するためのものです。
フィッシャーメトリックの定義。
確率分布のパラメーター化されたファミリー(R nの密度で与えられる)を考えます。ここで、xはランダム変数で、シータはR pのパラメーターです。フィッシャー情報マトリックスF = (F i j)はD=(f(x,θ))RnxRpF=(Fij)
Fij=E[d(logf(x,θ))/dθid(logf(x,θ))/dθj]
この表記では、はリーマン多様体で、F (θ )はリーマン計量テンソルです。(このメトリックの関心は、クレイマーラオの下限定理によって与えられます)DF(θ)
あなたは言うかもしれません... OK数学的な抽象化ですが、KLはどこですか?
数学的な抽象化ではありません場合、パラメータ化された密度は(無限次元の空間のサブセットではなく)曲線として実際に想像でき、F 11はその曲線の曲率に接続されます...(精液を参照) Bradley Efronの論文http://projecteuclid.org/DPubS?service=UI&version=1.0&verb=Display&handle=euclid.aos/1176343282)p=1F11
幾何学的な点aの一部への答え/あなたの質問で:二乗距離 2間(近い)分布P (X 、θ )とP (X 、θ + D θ )マニホールドに(上の測地線距離を考えます近い2点の地球、それは地球の曲率に関連しています)は二次形式で与えられます:ds2p(x,θ)p(x,θ+dθ)
ds2=∑Fijdθidθj
そして、それはKullback Leibler Divergenceの2倍であることが知られています:
ds2=2KL(p(x,θ),p(x,θ+dθ))
それについてもっと知りたい場合は、Amari http://projecteuclid.org/DPubS?service=UI&version=1.0&verb=Display&handle=euclid.aos/1176345779から論文を読むことをお勧めし
ます。統計におけるリーマン幾何学ですが、名前は覚えていません)