ベイズの定理直観


22

私は、事前事後尤度、および限界確率の観点から、ベイズの定理の直観に基づいた理解を発展させようとしました。そのために、次の式を使用します ここで、は仮説または信念を表し、はデータまたは証拠を表します。 私は事後の概念を理解しました-それは、以前の信念と出来事の可能性を結合する統一体です。私が理解していないのは、可能性が何を意味するのか?そして、なぜ限界は AB

P(B|A)=P(A|B)P(B)P(A)
AB
分母の確率?
いくつかのリソースを確認した後、この引用に出会いました。

尤度は、イベントの重量の発生により与えられる ...ある事後イベントの確率イベントのことを考えると、発生しています。A P B | A BAP(B|A)ABA

上記の2つのステートメントは、私と同じように見えますが、異なる方法で書かれています。誰も2つの違いを説明できますか?


4
タイプミス(または誤解)があります。は「仮説または信念」であり、は製剤の「データまたは証拠」である必要があります。ABA
GUNG -復活モニカ

1
math.stackexchange.com/a/1943255/1505で私の答えを参照してください、それが私が直感的にそれを理解することになった方法です
リンドンホワイト

回答:


27

ベイズの法則には4つのコンポーネントがリストされていますが、3つの概念的なコンポーネントの観点から考えることを好みます。

P(B|A)2=P(A|B)P(A)3P(B)1
  1. 以前は、あなたが約信じ何であるの前に(すなわち、情報の新しいと関連する作品に遭遇した)。 AB A
  2. 後部には、あなたが信じている(あるいはあなたが合理的であれば、するべきである)については何ですかの後に新しい情報や関連作品に遭遇しました。 B
  3. 可能性の商は、情報の新しい部分の周辺確率で割ったインデックス情報性について自分の信念のための新しい情報の。 B

19

いくつかの良い答えが既にありますが、おそらくこれは何か新しいものを追加することができます...

ベイズの規則は、コンポーネントの確率の観点から常に考えています。これは、以下に示すように、イベントおよび観点から幾何学的に理解できます。BAB

イベントセット

周辺確率 および、対応する円の面積によって与えられます。考えられるすべての結果は、イベントのセット「または」に対応するで表されます。結合確率イベント「に対応する及び」。P B P A B = 1 A B P A B A BP(A)P(B)P(AB)=1AB P(AB)AB

このフレームワークでは、ベイズの定理の条件付き確率は、面積の比率として理解できます。確率所与の一部であるによって占有として表さ、 同様に、確率所与の割合でによって占有、すなわち、 B B A B P A | B = P A B ABBAB BAAABPB|A=PAB

P(A|B)=P(AB)P(B)
BAAAB
P(B|A)=P(AB)P(A)

ベイズの定理は、実際には上記の定義の数学的な結果であり、 Iこの対称形のベイズ定理は、はるかに覚えやすいとわかります。つまり、アイデンティティは、またはが「前」と「後」のどちらにラベル付けされているかに関係なく保持されます。、P A P B

P(B|A)P(A)=P(AB)=P(A|B)P(B)
p(A)p(B)

(上記の議論を理解する別の方法は、この質問に対する私の答えに、より「会計上のスプレッドシート」の観点から与えられています。)


9

@gungには素晴らしい答えがあります。実際の例で「開始」を説明するために1つの例を追加します。

実世界の例とのより良い接続のために、表記法を変更します。ここで、を使用して仮説(方程式の)を表し、を使用して証拠を表します。(方程式の)A E BHAEB

したがって、式は

P(H|E)=P(E|H)P(H)P(E)

同じ式を次のように書くことができることに注意してください

P(H|E)P(E|H)P(H)

ここで、はに比例することを意味、は尤度、は事前確率です。この方程式は、方程式の右側が大きくなると、後部が大きくなることを意味します。そして、は、数を確率にするための正規化定数であると考えることができます私がそれを定数と言う理由は、証拠が既に与えられているためです)。P(E|H)P(H)P(E)E

実際の例として、クレジットカードトランザクションで不正検出を行っているとします。次に、仮説はここで、トランザクションは正常または不正であることを表します。(直感を示すために極端な不均衡なケースを選びました)。H{0,1}

ドメインの知識から、ほとんどの取引は正常であり、ごく少数の取引のみが不正であることがわかっています。私たちはそこにある私たちに語った専門家を想定してみましょうで詐欺だろう。したがって、事前確率はおよびと言えます。11000P(H=1)=0.001P(H=0)=0.999

最終的な目標はを計算することです。これは、priorityに加えて、取引が証拠に基づいていない詐欺であるかどうかを知りたいことを意味します。方程式の右側を見ると、それを尤度事前に分解します。P(H|E)

すでに何が優先されているかを説明したところで、ここでは可能性が何であるかを説明します。 2種類の証拠があるとします。これらの証拠は、トランザクションの通常のまたは奇妙な地理的位置を見ている場合を表します。E{0,1}

尤度は小さい可能性があります。これは、通常のトランザクションが与えられていることを意味し、ロケーションが奇妙である可能性は非常に低いです。一方、は大きくなる可能性があります。P(E=1|H=0)P(E=1|H=1)

を観察して、それが詐欺かどうかを確認したい場合、事前確率と尤度の両方を考慮する必要があるとします。直感的に、以前から、不正取引が非常に少ないことを知っています。証拠が非常に強い場合を除き、不正の分類を行うのは非常に保守的です。したがって、2つの間の積は2つの要因を同時に考慮します。E=1


前にタイプミスがあるかもしれないと思う:は、である必要がありますか?P(H=0)0.999P(H=1)=0.001
gc5

1

ベイズのルールは

P(a|b)=P(b,a)P(b)=P(b,a)P(b)P(a)P(a)

比率に注意してください

P(b,a)P(b)P(a).

もし、次いで、。つまり、ジョイントが完全な独立性からどれだけ逸脱しているか、または変数に共通する情報量を伝えるようなものです。BAP(b,a)=P(b)P(a)

興味深いことに、この比率のログは相互情報にも存在します。

I(A|B)=a,bP(a,b)logP(b,a)P(b)P(a)


0

定理をテーブルとして表示し、「B」の可能な結果を​​行として、「A」の可能な結果を​​列として表示することがよくあります。結合確率は、各セルの値です。この表にはP(A,B)

尤度=行の比率事後=列の比率

事前および限界は同様に定義されますが、特定の列ではなく「合計」に基づきます

限界=行の合計比率前=列の合計比率

これは私を助けます。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.