私の回答では、ここのスペースを節約するために、背景資料への多くのリンクを提供します。記載されているリンクの情報をもとに、回答を書きます。
ベイジアンアプローチはこの問題に自然に当てはまると思います。特に、自分だけを説得しようとしているからです。とがからのサンプルを与えられたことがどれほどもっともらしいかについて、信頼区間を使用して本当に気になる質問に答えるのは少し複雑です分布?ベイジアンアプローチでは、この問題に直接対処できます。Q7<Q6Q7<Q8zi
尤度関数
ましょう整数アウトカムの観測された周波数とあなたのサンプル中とletサンプルサイズです。尤度関数はに比例している多項分布。それは形をしていますfkkN
L(z0,...z8;f0,...f8)=∏8i=0ziNfi。
事前配布
ディリクレ分布は、それがあるため、事前分布のための自然な選択である共役事前多項可能性について。それは形をしています
p(z0,...z8;α0,...,α8)∝∏8i=0ziαi−1
この以前のには9つのハイパーパラメーター(値)があり、それらを扱うのは少しです。この「大きなサンプル」のコンテキストでは、ハイパーパラメーター値の合理的な選択は結果にほとんど影響を与えませんが、それでも、実用的な値を選択するために少し努力する価値があると思います。αi
ハイパーパラメーターの設定をお勧めする方法は次のとおりです。まず、この分布の下でであることに注意してください。次に、自然に対する最も単純な最大エントロピー分布は幾何学的分布であることに注意してください。だから設定E(zi)=αi∑8i=0αi
αi+1=rαi=riα0,0<r<1,
α0=A(1−r1−r9).
次に、なので、分布値は、(切り捨てられた)幾何分布に中心があります。さらに、なので、の値はこの期待値の周りの分散を制御しますが、期待値には影響しません自体。E(zi)=ri(1−r1−r9)ziVar(zi)∝1(A+1)A
この指定により、ハイパーパラメーターの数が9つの値からと減少します。ここでは、と特定の値についての説明は延期します。αirArA
興味のある命題の事後確率
値の事後分布は、次のディリクレ分布です。zi
p(z0,...z8|f0,...,f8)∝∏8i=0ziαi+Nfi−1.
してみましょう。あなたが興味を持っている事後確率はY={z0,...z8|Q7<Q6 and Q7<Q8}
Pr(Q7<Q6 and Q7<Q8|f0,...,f8)∝∫Y∏8i=0ziαi+Nfi−1dzi.
この積分は扱いにくいですが、次のモンテカルロアルゴリズムを使用して関心の確率を数値で計算できます。
以下のためのからに、j1J
事後分布から値のセットをサンプリングします。zi
サンプル値を使用して、計算します。ここで、はインジケーター関数です。yj=I(Q7<Q6)I(Q7<Q8)I(⋅)
次に、です。Pr(Q7<Q6 and Q7<Q8|f0,...,f8)≈∑Jj=0yjJ
モンテカルロ近似の精度は、のように進む:あなたの精度の少なくとも二つの小数点以下の桁数20のうち19回、取得するあなたの少なくとも三つの小数点以下の桁数を取得します精度は20のうち19倍などJ−−√J=104J=106
そして、関心のある事後確率が0または1に近くない場合は、より多くのデータをサンプリングし、すすぎ、繰り返します。
以前のハイパーパラメータ、パート2
事後密度の式におけるの指数はzi
αi+Nfi−1=Ari(1−r1−r9)+Nfi−1=AE(zi)+Nfi−1
ハイパーパラメータは、が尤度で果たすのと同じ役割を事前分布で果たしていることがわかります。これは、一種の「事前サンプルサイズ」です。事前分布が結論に無視できる影響を与えるようにするには、ような値を選択します。たとえば、です。ANAA≪NA=1
を設定するには、前述の同じモンテカルロアルゴリズムを使用して、命題の事前確率を計算できますが、事前分布はステップ1の事後分布の代わりにループ。0.5の事前確率を与える値を見つけてみてください(それが妥当であると思われる場合は、それよりも低くなります)。rQ7<Q6 and Q7<Q8r