濃度パラメーターに超優先分布がある多項式ディリクレモデル


10

手元にある問題をできるだけ一般的に説明するようにします。私は、観測値をパラメーター確率ベクトルシータを持つカテゴリカル分布としてモデル化しています。

その後、私はパラメータベクトルシータは、以下を前提とディリクレ事前パラメータを持つ分布α1,α2,,αk

また、パラメータを超えるhyperprior分布を課すことがことが可能である?カテゴリー分布やディリクレ分布などの多変量分布でなければなりませんか?私にはアルファが常に正であるように見えるので、ガンマハイパープライアが機能するはずです。α1,α2,,αk

誰かがそのような(おそらく)過剰パラメータ化されたモデルをフィッティングしようとしたが、アルファは修正されるべきではなく、ガンマ分布からのものであると考えるのが合理的であるかどうかわからない。

このようなアプローチを実際にどのように試すことができるかについての参考情報と洞察を提供してください。


はい、これは可能であり、実行されています。一般に、これはベイズ階層モデルと呼ばれます。好ましくは、この事前は、依存関係の可能性を考慮に入れるべきです。

@Procrastinatorありがとう。この種のモデルを扱う優れたベイジアン階層モデルのリファレンスはありますか?ありがとう。
ドナイエル

@Procrastinator:ベイジアン階層モデルに関する論文/レポート、または理想的には実践的なアプリケーションドキュメントを入手するように管理していますか?
Zhubarb 2013年

回答:


12

α1=α2=...αKα<1α>1

スパースまたはデンスの多項分布のいずれにも強い期待がない場合は、ディリクレ分布よりもハイパープライオリティを高くすることで、モデルを柔軟に選択できます。

βDirichlet(1)λExponential()θDirichlet(βλ)

追加のディリクレは、単に対称性を課すことを避けるためのものです。

また、多項式放出分布を伴う隠れマルコフモデルのコンテキストでディリクレの前にガンマハイパーだけを使用する人を見たことがありますが、参照が見つからないようです。また、トピックモデルで使用されている同様のハイパーに遭遇したようです。


すばらしい答えをありがとう!1つの短いフォローアップQがあります。このモデルでは、シータごとに異なる変動が可能ですか?パラメータlambdaはすべてのシータで共有されているため、この質問があります。これらはすべて同じスケーリングパラメーターを共有しているため、過剰分散の場合、モデルがそのような柔軟性を提供するのではないかと考えていました。ここでのあなたの直感/知識は大歓迎です!ありがとう!
ドナイエル

Dirichlet(0.2,0.2,0.2,0.2)θθβ

4

この超優先問題の解決策を示すために、私はPyMC3に階層的ガンマディリクレ多項式モデルを実装しました。ディリクレのガンマ事前分布は、テッドダンニングのブログ投稿に従って指定およびサンプリングされています。

私が実装したモデルは、この要点で見つけることができますが、以下でも説明されています。

これは映画の評価のためのベイジアン階層(プーリング)モデルです。各映画は0から5までのスケールで評価できます。各映画は数回評価されます。各映画の評価の滑らかな分布を見つけたいと思います。

データから映画の評価に関する最上位の事前分布(ハイパープライア)を学習します。各映画には、この最上位レベルの事前処理によって平滑化された独自の事前処理があります。これについての別の考え方は、各映画の事前評価がグループレベルまたはプールされた配布に向けて縮小されることです。

映画に非定型の格付け分布がある場合、このアプローチにより、格付けは期待されるものにより近いものに縮小されます。さらに、この学習済みの事前学習は、レーティングが少ないムービーをブートストラップして、レーティングが多いムービーと比較して意味のあるものにするのに役立ちます。

モデルは次のとおりです。

γk=1...KGamma(α,β)

θm=1...MDirichletM(cγ1,...,cγK)

zm=1...M,n=1...NmCategoricalM(θm)

どこ:

  • KK=6
  • M
  • Nmm
  • α=1/K
  • β
  • c
  • γkk
  • θmK
  • zmnnm

1

これは、モデリング前の直接ベイズ共役です。Beta-Binomialモデルからの自然な拡張。このために良いリソースからかもしれない。後部もディリクレなので、ディリクレからシミュレーションすると必要な要約が得られます


1
ありがとう。私はそのような本に精通しています。私はそれを調べてみましたが、それらはそのような多項階層モデルを直接提供していませんが、適用できる優れたアイデアがたくさんあります。
ドナイエル

1
dirichlet-multinomialは共役モデルですが、opはDirichletのパラメーターについて(hyper-)前について問い合わせました。ディリクレ分布の前には標準的な共役はありませんが、指数ファミリーのメンバーであるため実際には存在する必要があります。
jerad
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.