二項分布からいくつかのサンプルを取得するとします。私の以前の知識をモデル化する1つの方法は、パラメーターおよびベータ分布を使用することです。私が理解しているように、これは試験で「頭」を回見たのと同じです。そのため、本格的なベイジアン推論を行うための良い近道は、回の試行で頭を見た後の「頭」の確率の新しい平均としてを使用することです。β α α + β H + α HのN
ここで、3つ以上の状態があると仮定します。そのため、多項分布からいくつかのサンプルを取得します。事前分布としてパラメーターを使用したディリクレ分布を使用するとします。ここでもショートカットとして、これをイベントの確率の事前知識としてと同等に扱うことができます回の試行でイベント回を目撃した場合、私の事後なります。。I α I IHNIH+αI
今二項の場合には、それは「頭」の事前知識が発生していることをうまくいくで時間を裁判起こる「尾」に相当しますで時間をトライアル。論理的には、「尾」よりも「頭」の可能性についてより強い知識を持つことができるとは思いません。ただし、これは2つ以上の結果を伴ってより興味深いものになります。私が6面ダイスと言った場合、50トライアルではサイド1の事前知識は10に相当し、100トライアルではサイド2の事前知識は15 2に相当すると想像できます。α + β β α + β
それで、すべての紹介の後で、私の質問は、多項式の場合にそのような非対称の事前知識を適切にモデル化する方法ですか?注意しないと、合計確率/尤度が1にならないため、簡単に非論理的な結果が得られるようです。ディリクレショートカットを引き続き使用できる方法はありますか、これを完全に犠牲にして使用する必要がありますか。他の事前配布は完全に?
上記の表記法や用語の乱用によって引き起こされる混乱を許してください。
If I have say a 6-sided die, I can imagine my prior knowledge of side "1" being equivalent to 10 ones in 50 trials and my prior knowledge of side "2" as being equivalent to 15 twos in 100 trials.
最小公倍数を使用して「」と「2」(つまり50と100)の「同等のサンプルサイズ」を統一したくない特別な理由はありますか?この場合にはα 1 = 20 / 100およびα 2 = 15 / 100。