ラプラス平滑化とディリクレ事前


11

ラプラス平滑化(または加法平滑化)のウィキペディアの記事では、ベイズの観点から、

これは、事前分布としてパラメーターを持つ対称ディリクレ分布を使用して、事後分布の期待値に対応します。α

それが実際にどのように真実であるかについて私は困惑しています。誰かが私にそれらの2つのものが同等である方法を理解するのを手伝ってくれる?

ありがとう!

回答:


10

承知しました。これは基本的に、ディリクレ分布が多項分布の共役の前であるという観察です。これは、それらが同じ機能形式を持っていることを意味します。記事ではそれについて触れていますが、これは多項式サンプリングモデルに基づいていることを強調しておきます。だから、それに取り掛かります...

観察は事後に関するものなので、いくつかのデータ導入しましょう。これは、異なるアイテムのカウントです。サンプルの合計を観察します。我々は仮定します未知の分布から引き出される(私たちが出してあげるその上の前に -simplex)。xKN=i=1KxixπDir(α)K

とデータが与えられたの事後確率は、παx

p(π|x,α)=p(x|π)p(π|α)

尤度は多項分布です。次に、PDFを書き出します。p(x|π)

p(x|π)=N!x1!xk!π1x1πkxk

そして

p(π|α)=1B(α)i=1Kπiα1

ここで、です。掛け算すると、B(α)=Γ(α)KΓ(Kα)

p(π|α,x)=p(x|π)p(π|α)i=1Kπixi+α1.

つまり、後部ディリクレです。問題は事後平均についてでした。事後はディリクレであるため、ディリクレの平均の式を適用して、

E[πi|α,x]=xi+αN+Kα.

お役に立てれば!


p(π|α,x)=p(x|π)p(π|α)/p(x|α),なので、それらは比例しますが、等式を書くのは本当ではないと思います。p(π|α,x)=p(x|π)p(π|α)?π
michal 2016年

私はこれについて長い間混乱していました、そして私の認識を共有したいと思います。ディリクレによるラプラス平滑化を動機付けるこれらの人々は、MAPではなく事後平均を使用しています。簡単にするために、ベータ分布(ディリクレの最も単純なケース)を想定します。事後平均はが、MAPは。したがって、誰かが 1が分子に1を、分母に2を追加することに対応していると言うのは、事後平均を使用しているためです。α+nsuccessα+β+nsuccess+nfailuresα+nsuccess1α+β+nsuccess+nfailures2α=β=1
RMurphy 2017年

0

余談ですが、私はまた、上記の導出に別のポイントを追加したいと思います。それは、本当の質問には関係ありません。ただし、多項分布のディリクレ事前分布について説明すると、確率を迷惑変数とする場合、尤度関数の形式はどのようなものになるかについて言及する価値があると思いました。

sydeulissieによって正しく指摘されているように、は比例します。ここで、を計算します。p(π|α,x)i=1Kπixi+α1p(x|α)

p(x|α)=i=1Kp(x|πi,α)p(π|α)dπ1dπ2...dπK

ガンマ関数に積分単位を使用すると、次のようになります。

p(x|α)=Γ(Kα)Γ(N+Kα)i=1KΓ(xi+α)Γ(α)

上記のカテゴリカルデータの尤度の導出は、サンプルサイズが十分に大きくない場合に、このデータを処理するより堅牢な方法を提案します。N

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.