ラプラス平滑化(または加法平滑化)のウィキペディアの記事では、ベイズの観点から、
これは、事前分布としてパラメーターを持つ対称ディリクレ分布を使用して、事後分布の期待値に対応します。
それが実際にどのように真実であるかについて私は困惑しています。誰かが私にそれらの2つのものが同等である方法を理解するのを手伝ってくれる?
ありがとう!
ラプラス平滑化(または加法平滑化)のウィキペディアの記事では、ベイズの観点から、
これは、事前分布としてパラメーターを持つ対称ディリクレ分布を使用して、事後分布の期待値に対応します。
それが実際にどのように真実であるかについて私は困惑しています。誰かが私にそれらの2つのものが同等である方法を理解するのを手伝ってくれる?
ありがとう!
回答:
承知しました。これは基本的に、ディリクレ分布が多項分布の共役の前であるという観察です。これは、それらが同じ機能形式を持っていることを意味します。記事ではそれについて触れていますが、これは多項式サンプリングモデルに基づいていることを強調しておきます。だから、それに取り掛かります...
観察は事後に関するものなので、いくつかのデータ導入しましょう。これは、異なるアイテムのカウントです。サンプルの合計を観察します。我々は仮定します未知の分布から引き出される(私たちが出してあげるその上の前に -simplex)。
とデータが与えられたの事後確率は、
尤度は多項分布です。次に、PDFを書き出します。
そして
ここで、です。掛け算すると、
つまり、後部もディリクレです。問題は事後平均についてでした。事後はディリクレであるため、ディリクレの平均の式を適用して、
お役に立てれば!