バイナリ(2カム)プロセスの観測値がである状況を考えます。多くの場合、各試験で考えられる2つの結果は、成功と失敗と呼ばれます。n = 20
頻繁な信頼区間。試行で成功を観察するとします。成功数を確率変数ここで、成功確率は不明な定数です。Wald 95%頻出信頼区間は、推定値である基づいてい
通常の近似を使用すると、このCIはまたは
の形式になり[
95%CI のやや改善されたアグレスティクールスタイルは 0.526、0.890x = 15n = 20バツバツ〜B I 、N 、O 、M(N = 20 ; P )、pp^= 15 / 20 = 0.75 、p 。p^± 1.96p^(1 −p^)/ n−−−−−−−−−√(0.560 、0.940 )。(0.526 、0.890 )。]
一般的な解釈は、そのような間隔を生成する手順では、長期にわたってインスタンスの95%にの真の値を含む信頼限界の上限と下限が生成されるというものです。[Agresti-Coull間隔の利点は、そのような包含の長期的な比率がWald間隔よりも95%に近いことです。]p
ベイジアンの信頼できる区間。ベイジアンアプローチは、を確率変数として扱うことから始まります。データを確認する前に、実施されている種類の二項実験の経験がない場合、またはの分布に関する個人的な見解がない場合は、「均一」または「非情報」の均一分布を選択できますpp 、P 〜U N I F(0,1)≡Beta(1,1).
次に、20回の二項試行で15回成功すると、事前分布と二項尤度関数の積として、の事後分布がわかります。p
f(p|x)∝p1−1(1−p)1−1×p15(1−p)5∝p16−1(1−p)6−1、
ここで、記号( 'proportional to'を読み取る)は、含まない分布の「正規化」定数因子を省略していることを示します
規範因子がない場合、密度関数またはPMFは、分布の「カーネル」と呼ばれます。αp 。
ここで、事後分布のカーネルは、分布のカーネルであることを認識しています次に、事後分布の各裾から2.5%をカットすることにより、95%のベイジアン事後区間または信頼できる区間が見つかります。これはRからの結果です:
[ベータ版の配布については、ウィキペディアを参照してください。]B用のE のT A(16、6)。(0.528 、0.887 )。
qbeta(c(.025,.975), 16, 6)
[1] 0.5283402 0.8871906
以前の結果が妥当であると考え、20試行の2項式実験が適切に行われたと考える場合、理論的には、ベイジアンインターバル推定値が手元の実験に関する有用な情報を提供することを期待する必要があります。将来を実行します。
このベイジアンの信頼できる区間は、数値的にはアグレスティクール信頼区間に似ています。ただし、ご指摘のとおり、2つのタイプの区間推定(頻度主義者とベイジアン)の解釈は同じではありません。
有益な事前。データを見る前に、を信じる理由があった場合、以前の分布としてを選択した可能性があります。[この分布は平均2/3、標準偏差は0.35であり、その確率の約95%を区間]P ≈ 2 / 3 、B用のE のT A(8、4)(0.39 、0.89 )。
qbeta(c(.025,.975), 8,4)
[1] 0.3902574 0.8907366
その場合、事前確率に尤度を乗算すると、の事後カーネルが得られる
ため、95%のベイジアン信頼区間は
事後分布は、事前の情報と可能性の融合であり、おおまかに一致しているため、結果のベイジアン間隔の推定値は、フラットな事前分布からの間隔よりも短くなります。BのE T(23、7)、(0.603 、0.897 )。
qbeta(c(.025,.975), 23,7)
[1] 0.6027531 0.8970164
注:(1)ベータ事前分布と二項尤度関数は「共役」です。つまり、計算なしで事後分布を見つけることができるように数学的に互換性があります。場合によっては、尤度と共役な事前分布がないように見えます。次に、事後分布を見つけるために数値積分を使用する必要がある場合があります。
(2)情報のない事前分布からのベイジアンの信頼できる区間は、基本的には尤度関数に依存します。また、頻度論的推論の多くは尤度関数に依存します。したがって、フラットな事前分布からのベイズの信頼できる区間が、同じ尤度に基づく頻度主義の信頼区間と数値的に類似している可能性があることは驚くべきことではありません。