点ごとの相互情報の境界が与えられた相互情報の境界


18

2つのセットとあり、これらのセット同時確率分布があるとします。ましょう及び上に周辺分布示すおよびそれぞれ。Y p x y p x p y X YXYp(x,y)p(x)p(y)XY

と間の相互情報は次のように定義されます: Y I X ; Y = Σ X Y P X Y ログP X Y XY

I(X;Y)=x,yp(x,y)log(p(x,y)p(x)p(y))

すなわち、点ごとの相互情報pmiの平均値です。(x,y)log(p(x,y)p(x)p(y))

pmi上限と下限を知っていると仮定します。つまり、すべての次のことが成り立つことを知っています。- のX Y - K ログP X Y (x,y)x,y

klog(p(x,y)p(x)p(y))k

何の上限は、これは上の意味するものではありません。もちろん、これは意味しが、可能であれば、より厳密な範囲が必要です。pは確率分布を定義し、pmiはおよびすべての値に対して最大値を取ることができない(または負でないことさえある)ため、これは私にはもっともらしいようです。I X ; Y K X Y のX YI(X;Y)I(X;Y)k(x,y)xy


1
結合確率と周辺確率が一様である場合、pmi(、)は一様にゼロです(したがって、負ではないため、最後のステートメントと明らかに矛盾しますが、わずかです)。間違っていなければ、小さなサブセットでこの状況を混乱させることは、pmiの境界が自体についてほとんど何も言っていないこと示しているように思えます。y X × Y I X ; Y xyX×YI(X;Y)
whuber

1
実際、とが独立している場合、周辺分布に関係なく、は一定です。そう分布の全体のクラスがありますれるすべてのために、その最大値を求めと。Y p m ix y p x y p m ix y x yXYpmi(x,y)p(x,y)pmi(x,y)xy
枢機

はい、確かにpmiがすべてのとで等しくなる可能性はありますが、より厳密な境界を排除するものではありません。たとえば、あること証明するのは難しくありません。これは、とき、およびバウンドの非自明な強化である。もっと一般的に成り立つ非自明な境界があるのだろうか。のX Y I X ; Y K EのK - 1 K 2、K < 1 、K 、K < 1(x,y)xyI(X;Y)k(ek1)k2k<1kk<1
フローリアン

1
に対してよりも良い境界が得られるかどうかは疑問です。もっと見たければ、p(x)p(y)とp(x、y)の間のKLの発散に関して質問を再構成してみてください。ピンスカーの不等式は、私の予想を裏付ける可能性のあるMIの下限を提供します。ajmaa.org/RGMIA/papers/v2n4/relog.pdfのセクション4も参照してください。O(k2)k0
vqv

回答:


5

私の貢献は例で構成されています。これは、ポイントワイズ相互情報の範囲を指定して、相互情報をどのように制限できるかについてのいくつかの制限を示しています。

すべてのおよびを取ります。任意の、方程式の解とし その後、我々は質点場所で製品空間内の点があるようにの各行及び各列のこれらの点の。(これはいくつかの方法で実行できます。たとえば、最初の行の最初のポイントから開始し、シフトして残りの行を埋めます。X=Y={1,,n}p(x)=1/nxXm{1,,n/2}k>0

mek+(nm)ek=n.
ek/n2nm{1,,n}2mmm各行の循環境界条件で1を右に指します)。ポイントマスを残りのポイントに配置します。これらの点質量の合計は ため、確率尺度を提供します。すべての周辺点確率は そのため、両方の周辺分布は均一です。ek/n2n2nm
nmn2ek+n2nmn2ek=mek+(nm)ekn=1,
mn2ek+mnn2ek=1n,

構成によっては明らかなようにすべてのためいくつかの後、及び(計算) と動作する相互情報のためにおよびAS用。pmi(x,y){k,k},x,y{1,,n}

I(X;Y)=knmn2ekkn2nmn2ek=k(1ekekek(ek+ek)ek),
k2/2k0kk


1

これがあなたが探しているものであるかどうかはわかりません、それはほとんど代数的であり、確率分布であるpの特性を実際に活用していないので、ここであなたが試すことができるものです。

pmiの境界により、明らかに、したがって。我々は、置換することができるにを取得するp(x,y)p(x)p(y)ekp(x,y)p(x)p(y)ekp(x,y)I(X;Y)I(X;Y)x,yp(x)p(y)eklog(p(x)p(y)ekp(x)p(y))=x,yp(x)p(y)ekk

それが役立つかどうかはわかりません。

編集:さらに検討すると、これは実際にはkの元の上限よりも有用ではないと思います。ただし、開始点が示唆される場合に備えて、これは削除しません。


この境界の値は、および()注意した後に明らかになります。K 0 E K1x,yp(x)p(y)=1k0ek1
whuber

はい、編集したことに気付いたとき。
マイケル
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.