回答:
パラメーターの事前確率は、ほとんどの場合、特定の機能形式(通常、密度の観点から記述)を持ちます。分布の特定のファミリーに限定するとします。この場合、事前分布を選択すると、そのファミリーのパラメーターを選択することになります。
例えば、通常のモデルを検討。簡単にするために、のも見てみましょう知られているように。モデルのこの部分-データのモデル-尤度関数を決定します。
ベイジアンモデルを完成させるには、ここで事前分布が必要です。
上記のように、通常、事前分布に分布族を指定し、その分布のパラメーターを選択するだけです(たとえば、多くの場合、事前情報はかなり曖昧な場合があります-ほぼ確率を集中させたい場合-非常に具体的な機能形式ではなく、パラメータを選択することで必要なものをモデル化するのに十分な自由がある場合があります-以前の平均と分散に一致するように言います)。
の事後分布が事前分布と同じファミリーのものであることが判明した場合、その事前分布は「共役」と呼ばれます。
(共役になることが判明するのは、尤度と組み合わせる方法です)
したがって、この場合には、のためにガウス前にみましょう(言うμ 〜N (θ 、τ 2))。そうすると、μの事後分布もガウス分布になることがわかります。したがって、ガウス事前分布は、上記のモデルの共役事前分布でした。
それだけです-事後が事前と同じファミリーからのものである場合、それは共役事前です。
単純なケースでは、尤度を調べることで事前に共役を特定できます。たとえば、二項尤度を考えます。定数を削除すると、ベータ密度のように見えます。および方法のための力のPと(1 - P )コンバイン、それはまたのべき乗の積与える前に乗算ベータによって意志のpと(1 - pは)我々は可能性から、すぐに見ることができるように...ベータは、二項尤度のpの事前共役です。
ガウスの場合、対数密度と対数尤度を考慮することで発生することを確認するのが最も簡単です。対数尤度はの2次であり、2つの2次の合計は2次です。そのため、2次の対数優先+ 2次の対数尤度は2次の事後を与えます(もちろん、最高次項の係数はそれぞれ負になります)。
モデルは、に属している場合、指数ファミリー分布の密度がフォームである場合、であり、
優越尺度の選択は、事前分布のファミリーにとって決定的です。例えば1は上の通常の平均可能性直面している場合はのようにGlen_bの答え、ルベーグ測度の選択通常の事前確率が共役であることに支配的な対策のリード線などを。代わりに、1つを選択した場合支配的な尺度としては、共役事前確率は密度の分布のファミリー内にある
この指数ファミリー設定の外には、共役事前確率を可能にする固定サポートを持つ分布の非自明なファミリーはありません。これはDarmois-Pitman-Koopmanの補題の結果です。
ディストリビューションの「カーネル」という概念を使用するのが好きです。これは、パラメータに依存する部分のみを残す場所です。いくつかの簡単な例。
通常カーネル
ベータカーネル
尤度関数を見ると、同じことができ、それを「カーネル形式」で表現できます。たとえば、iidデータ
いくつかの定数といくつかの関数。この関数をカーネルとして認識できれば、その尤度の前に共役を作成できます。単位分散で正規尤度をとると、上記は
where and and
This likelihood function has the same kernel as the normal distribution for , so a conjugate prior for this likelihood is also the normal distribution.
In some sense a conjugate prior acts similarly to adding "pseudo data" to the data observed, and then estimating the parameters.
For a given distribution family of the likelihood (e.g. Bernoulli),
if the prior is of the same distribution family as the posterior (e.g. Beta),
then and are conjugate distribution families and the prior is called a conjugate prior for the likelihood function.
Note: