log(p(x、y))はどのようにして点ごとの相互情報を正規化しますか?


9

私は点ごとの相互情報の正規化された形式を理解しようとしています。

npmi=pmi(x,y)log(p(x,y))

なぜ対数結合確率は、点ごとの相互情報を[-1、1]の間に正規化するのですか?

ポイントごとの相互情報は次のとおりです。

pmi=log(p(x,y)p(x)p(y))

p(x、y)は[0、1]によって制限されるため、log(p(x、y))は(、0]によって制限されます。log(p(x、y))は、分子ですが、正確にはわかりません。また、エントロピー思い出しますが、正確な関係はわかりません。h=log(p(x))


まず、ポイントごとの相互情報は対数を使用します(タイプミスか別の数量を使用しているかはわかりません)。
Piotr Migdal 2015年

回答:


12

個別の相互情報に関するウィキペディアのエントリから:

点ごとの相互情報を[-1、+ 1]の間で正規化すると、一緒に発生しない場合は-1(制限内)、独立性の場合は0、完全な共起性の場合は+1になります。

なぜそれが起こるのですか?さて、ポイントワイズ相互情報の定義は

pmilog[p(x,y)p(x)p(y)]=logp(x,y)logp(x)logp(y),

一方、正規化された点ごとの相互情報は次のとおりです。

npmipmilogp(x,y)=log[p(x)p(y)]logp(x,y)1.

あるとき:

  • 共起なし、、したがってnmpiは-1logp(x,y)
  • ランダムに共起、なので、nmpiは0、logp(x,y)=log[p(x)p(y)]
  • 完全な共起、なので、 nmpiは1です。logp(x,y)=logp(x)=logp(y)

npmiが間隔にある理由を示すと、より完全な答えになります。他の答えで私の証拠を参照してください。[1,1]
Hans

1

Piotr Migdalの回答は、nmpiが3つの極値を達成する例を示すのに有益ですが、区間にあることを証明していません。ここに不平等とその派生があります。 としてイベント場合。非負のですると、 [1,1]

logp(x,y)logp(x,y))logp(x)logp(y)=logp(x,y)p(x)p(y)=:pmi(x;y)=logp(y|x)+logp(y|x)logp(x,y)logp(x,y)
logp(A)0Ah(x,y):=logp(x,y)
1nmpi(x;y):=mpi(x;y)h(x,y)1.

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.