なぜ人々は「証拠の重み」という用語を使用し、それが「個別の相互情報」とどのように異なるのですか?


11

ここで、「証拠の重み」(WOE)は、公開された科学的および政策立案の文献における一般的な用語であり、以下によって定義されるリスク評価のコンテキストで最もよく見られます。

w(e:h)=logp(e|h)p(e|h¯)

ここで、は証拠、hは仮説です。eh

今、私はPMI(点ごとの相互情報)との主な違いは何であるか知りたいです

pmi(e,h)=logp(e,h)p(e)p(h)

私は、この用語は、この論文で鋳造されたと考えている:projecteuclid.org/...
JohnRos

回答:


5

それらは同じように見えますが、まったく異なるものです。大きな違いから始めましょう。

  • はPMIとWOEで異なるものです。PMIh
    の用語に注意してください。これは、 hが確率を計算できる確率変数であることを意味します。ベイジアンの場合は問題ありませんが、仮説にアプリオリの確率があると思わない場合は、仮説と証拠のPMIを作成することもできません。WOEでは、 hは分布のパラメーターであり、式は常に定義されます。p(h)hh

  • PMIは、対称、WOEではないで
    自明、。ただし、W H E = ログP H | E / P H | ˉ Eために用語の定義である必要はないˉ E。たとえそうであっても、それは一般にw e hpmi(e,h)=pmi(h,e)w(h:e)=logp(h|e)/p(h|e¯)e¯w(e:h)

それ以外に、WOEとPMIには類似点があります。

証拠の重みは、証拠が仮説を支持してどれだけ話すかを示します。0の場合、それは反対も反対もしていません。それが高いほど、それは仮説検証、そしてそれが低いほど、それが検証ˉ 時間hh¯

相互情報は、イベント(またはh)の発生が他のイベントの発生について何かを言う方法を定量化します。0の場合、イベントは独立しており、一方の発生はもう一方について何も言わない。高いほど共起頻度が高く、低いほど相互排他的です。eh

hh1/100011log0.999/0.001=6.90116.90011

この逆説的な振る舞いは、2つのことを示しています。

  1. 11/10000116.90

  2. PMIは、仮説の実現に関する(シャノンの)情報の獲得です。仮説がほぼ確実である場合、情報は獲得されません。WOEは、以前のオッズの更新であり、これらのオッズの値には依存しません。


p(e|h)p(h)p(e|h)=p(e,h)p(h)

1
hp(e|h)p(h)
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.