ベイズ正規化定数の直感


8

スクリーニングの可能性が80%、事前確率が10%、偽陽性率が50%の一般的に言及されているマンモグラフィスクリーニング問題、またはそのバリアントでは、陽性スクリーニングが癌を示すという条件付き事後確率は簡単に説明できます。存在はわずか15%です。これは、n = 1000、真の癌症例= 100、検出された癌= 80、および偽陽性= 450のカウントによって最も簡単に示されます。陽性スクリーニングが癌の存在を示す確率は、真陽性/(真陽性+誤検知)または80 /(100 + 450)= 0.145または15%。

直感は、真陽性と偽陽性の合計がすべての結果のサブセットを構成するため、真陽性は真陽性と偽陽性の合計に条件付けられるということです。これは、偽陰性と真陰性が計算から除外されるため、条件付きセットがサブセットになるためです。

問題を二項尤度と事前ベータの連続ケースにシフトすると、正規化定数は真陽性の項(p =比例)のように積分になります。

01(nx)px(1p)nxΓ(a+b)Γ(a)Γ(b)pa1(1p)b1dp

偽陽性の同様の用語。

しかし、はっきりしないのは、継続的なケースでサブセットのアイデアをどのように言い換えるかであり、これを行う人を見つけることができません。むしろ、1)この積分は[0、1]間隔で定義された確率分布を持つために必要な計算を行うための定数を与えるか、2)比例性が呼び出され、積分の値は必要ないという言語を見つけます。特にMCMCを使用して事後を見つける、または3)積分は証拠の確率です。この最後の説明はサブセットのアイデアに近いようですが、明確かつ明示的に関連付けられていません。

私はベイズの定理の直感的な紹介を書いており、事後を定義する条件付き確率のサブセットの直感的なアイデアを継続したいと思います。したがって、この積分が離散数の場合のサブセットの継続的な再表示である方法を説明するための言語が必要です。

助言がありますか?


回答:


4

:私はこのデモのウェブサイトを作成して、私は、私が準備してるのコースのためにこれを行うために必要な二項の場合における『サブセットを選択する』などベイズの定理のデモンストレーションを(、右下のツールバーを非表示にすることを確認してください)。ちょうどである-基本的には、関節の分布を示した場合あなたが選択する必要があることを同時分布の「サブセット」を参照してくださいすることができ、それらのです-対応する値(観察したものはすべて)。p(yθ)p(θ)θY=y

そのページのソースコードは、Rmarkdown source for pageにあります

(はわかりにくいので、代わりにを二項確率に使用しました...)θpp(p)


2

あなたが述べた解釈の他に、正規化定数は観測されたxでの事前予測分布の値と考えることができます。事前予測が離散的である場合、これは確率質量であり、事前予測が連続的である場合、確率密度です。

事前予測は連続的な場合です

p(x)=Θp(θ)p(x|θ)

これは、サンプル空間の結果に確率質量/密度を割り当てる分布です。次に、xが観測されると、観測されたxに固定され、ベイズの定理の分母に適合します。

ただし、連続分布では、メジャーがゼロのセットに割り当てられた密度値に数学的な制約がないことに注意してください(つまり、確率ゼロ)。正確なxでの事前予測は任意に設定できます。しかしそれはさておき、正規化定数を視覚化するこの方法はかなり直感的だと思います。

詳しくはこちらをご覧ください。(アクセス権がない場合はお知らせください) これも少しモダンです。


1

リチャードの3Dグラフィックは非常に役に立ちました。ただし、必要なのは、原稿としてグラフとして貼り付けることができるものです。いくつか検索した後、この画像をWestfallとHenningの「高度な統計手法の理解」、Chapman&Hall / CRC、2013 から見つけました。

ここに画像の説明を入力してください

軸を左側の二項確率pおよび右側の成功回数yとしてラベルを付け直すと、二項分布が示され、結合分布の面が統合される周辺分布になります。

さらに、この共同配布により、これに関するボキャブラリーが不足していることがわかりました。その語彙は、確率の合計がテーブルのマージンに書き込まれている離散データを持つ双方向の分割表から来ているため、正規化定数の関連サブセットには「限界」という用語を使用します。共同配布の継続的なケースでは同じ語彙を引き続き使用しますが、それは説明的なものではありません。

しかし、WestfallとHenningの図から、正規化定数については、2項式の場合の成功数であるyの値の結合分布の「スライス」を統合していることがわかります。「スライス」は限界よりもはるかに明確であり、この図は、統合に関連するサブセットが何であるかを即座に明らかにします。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.