回答:
多くの頻度論的信頼区間(CI)は、尤度関数に基づいています。事前分布が本当に情報価値がない場合、ベイジアン事後分布は本質的に尤度関数と同じ情報を持ちます。その結果、実際には、ベイジアン確率区間(または信頼できる区間)は、頻度的に信頼区間に数値的に非常に似ている場合があります。[もちろん、たとえ数値的に類似していても、頻度主義者とベイズの区間推定値の間には解釈に哲学的な違いがあります。]
以下は、二項の成功確率推定する簡単な例です。 我々が持っていると仮定しと観測値(試験)成功を。
Frequentist:伝統的なワルド間隔用途点推定値 θ = X / N = 73 / 100 = 0.73。そして、95%CIは、フォームのある θ ± 1.96 √(0.643に
n = 100; x = 73; th.w = x/n; pm = c(-1,1)
ci.w = th.w + pm*1.96*sqrt(th.w*(1-th.w)/n); ci.w
[1] 0.6429839 0.8170161
この形式のCIは、関連する二項分布を正規分布で近似できること、および誤差範囲ウェルによって近似される √特にnが小さい場合、これらの仮定は真である必要はありません。[X=0またはX=nの場合は特に問題があります。]
Agresti-Coull CIは、より正確なカバレッジ確率を有することが示されています。この間隔は、カバレッジ確率を95%に近づけるためのトリックとして、「2つの成功と2つの失敗」を追加します。これは、点推定値で始まる 〜N + 4は次に95%CIがフォームである 〜θ ± 1.96 √ を計算し(0.612、0.792)。N>100と0.3<〜θ<0.7、信頼区間のこれらの2つのスタイルの違いはほとんど無視できる程度です。
ci.a = th.a + pm*1.96*sqrt(th.a*(1-th.a)/n); ci.a
[1] 0.6122700 0.7915761
ベイズ: 1つの一般noninformativeこの状況で前である尤度関数は、に比例する θ X(1 - θ )N - X。事前分布と尤度のカーネルを乗算すると、事後分布のカーネル B e t a(x + 1 、
次いで、95%ベイズ区間推定用途取得する事後分布の0.025と0.975の分位 事前分布が「フラット」または「非情報」である場合、ベイジアン確率区間とアグレスティ-コール信頼区間の数値差はわずかです。
qbeta(c(.025, .975), 74, 28)
[1] 0.6353758 0.8072313
注:(a)この状況では、一部のベイジアンは情報のない事前の好みます。(b)95%以外の信頼レベルの場合、Agresi-Coull CIはわずかに異なるポイント推定値を使用します。(c)二項分布以外のデータの場合、利用可能な「フラット」事前分布がない場合がありますが、非常に少ない情報を運ぶ大きな分散(精度が小さい)の事前分布を選択できます。(d)Agresti-Coull CI、カバレッジ確率のグラフ、およびいくつかの参考文献の詳細については、おそらくこのQ&Aも参照してください。
BruceETの答えは優れていますが、かなり長いので、簡単な実用的な要約を以下に示します。
頻度の高い信頼区間に等しい信頼できる区間が得られる事前分布を解くことができますが、適用範囲がどれほど狭いかを理解することが重要です。全体の説明では、サンプルサイズが固定されており、ランダム変数ではないと想定しています。データを1回だけ見て、順次推論が行われなかったと想定しています。従属変数は1つだけで、他のパラメーターは関係ないと想定しています。多重度がある場合、ベイジアン間隔と頻度間隔は分岐します(ベイジアン事後確率は前方時間予測モードであり、「ここに到達した方法」を考慮する必要がないため、複数の外観に調整する必要はありません)。加えて、
尤度関数、および信頼区間に関連付けられているものは、均一な分布を指定する事前確率で構築されたベイジアン事後確率と同じ(概念)ではありません。
この回答の第1部と第2部では、なぜ尤度をフラットな事前確率に基づいたベイジアン事後確率と見なすべきではないかを議論しています。
パート3では、信頼区間と信頼区間が大きく変化する例を示します。また、この矛盾がどのように生じるかが指摘されています。
確率は特定の方法で変換されます。我々は確率分布の分布がわかっている場合はその後、我々はまた、の分布を知る変数に対する任意の関数で定義されたが、変換規則に従って。
変数を変換する場合、分布関数のこの変更により、平均とモードが異なる場合があります。その手段と。
尤度関数は、この方法では変換しません。これは、尤度関数と事後確率の対比です。変数を変換しても、(最大の)尤度関数は同じままです。
関連:
平坦な事前分布はあいまいです。特定の統計の形式によって異なります。
例えば、場合(例えば、分散均一である次に、、ISません均一に分布変数。
尤度関数を関連付けることができる単一のフラットはありません。またはなどの変換された変数のフラット事前定義を定義する場合は異なります。可能性のために、この依存関係は存在しません。
変数を変換すると、確率の境界(信頼区間)が異なります(尤度関数の場合はそうではありません)。例えば、あるパラメータと単調変換(対数など)の場合、同等の尤度間隔
あなたは、変数サンプルとし(不明)パラメータを持つ集団から自体(パラメータを持つ人口)(のための可能性の変化値を持つ超母集団からサンプリングされました)。
変数Xのいくつかの値x iを観察することに基づいて、元のが何であったかを推測しようとする逆ステートメントを作成できます。
信頼区間はいません、信頼区間のように事前分布の情報を使用(信頼は確率ではありません)。
事前分布(均一または非均一)に関係なく、x%信頼区間にはxの真のパラメーターが含まれます。、ケースのに(信頼区間は、特定のケースではなく、メソッドの成功率、タイプIエラーを指します)。
信頼できる間隔の場合、この概念(間隔に真のパラメーターが含まれる時間)は適用できませんが、それを頻繁に解釈して、信頼できる間隔に(均一な)事前分布が正しく遭遇する可能性のあるパラメータの超集団を記述する。間隔は、x%よりも効果的に高いまたは低いパフォーマンスを示している可能性があります(ベイジアンアプローチはさまざまな質問に答えるため、これは重要ではありませんが、違いに注意するだけです)。
this functions expresses the probability to observe (for a given and ) a sample mean between and .
note: the rate parameter goes from to (unlike the OP 'request' from to ). The prior in this case will be an improper prior. The principles however does not change. I am using this perspective for easier illustration. Distributions with parameters between and are often discrete distributions (difficult to drawing continuous lines) or a beta distribution (difficult to calculate)
The image below illustrates this likelihood function (the blue colored map), for sample size , and also draws the boundaries for the 95% intervals (both confidence and credible).
The boundaries are created obtaining the (one-dimensional) cumulative distribution function. But, this integration/cumulation can be done in two directions.
The difference between the intervals occurs because the 5% area's are made in different ways.
The 95% confidence interval contains values for which the observed value would occur at least in 95% of the cases. In this way. whatever the value , we would only make a wrong judgement in 95% of the cases.
For any you have north and south of the boundaries (changing ) 2.5% of the weight of the likelihood function.
The 95% credible interval contains values which are most likely to cause the observed value (given a flat prior).
Even when the observed result is less than 5% likely for a given , the particular may be inside the credible interval. In the particular example higher values of are 'preferred' for the credible interval.
For any you have west and east of the boundaries (changing ) 2.5% of the weight of the likelihood function.
A case where confidence interval and credible interval (based on improper prior) coincide is for estimating the mean of a Gaussian distributed variable (the distribution is illustrated here: https://stats.stackexchange.com/a/351333/164061 ).
An obvious case where confidence interval and credible interval do not coincide is illustrated here (https://stats.stackexchange.com/a/369909/164061). The confidence interval for this case may have one or even both of the (upper/lower) bounds at infinity.
This is not generally true, but it may seem so because of the most frequently considered special cases.
Consider The interval is a confidence interval for albeit not one that anyone with any common sense would use. It does not coincide with a credible interval from the posterior from a flat prior.
Fisher's technique of conditioning on an ancillary statistic does in this case yield a confidence interval that coincides with that credible interval.
私の読書から、私はこの声明が漸近的に真実であると思った。すなわち、サンプルサイズが大きく、情報量の少ない事前分布を使用している場合。
単純な数値例はこれを確認するように思われます-ML二項GLMとベイジアン二項GLMの90%プロファイル最尤区間と90%信頼区間は、実際にはほぼ同一ですがn=1000
、小さな場合は不一致が大きくなりn
ます:
# simulate some data
set.seed(123)
n = 1000 # sample size
x1 = rnorm(n) # two continuous covariates
x2 = rnorm(n)
z = 0.1 + 2*x1 + 3*x2 # predicted values on logit scale
y = rbinom(n,1,plogis(z)) # bernoulli response variable
d = data.frame(y=y, x1=x1, x2=x2)
# fit a regular GLM and calculate 90% confidence intervals
glmfit = glm(y ~ x1 + x2, family = "binomial", data = d)
library(MASS)
# coefficients and 90% profile confidence intervals :
round(cbind(coef(glmfit), confint(glmfit, level=0.9)), 2)
# 5 % 95 %
# (Intercept) 0.00 -0.18 0.17
# x1 2.04 1.77 2.34
# x2 3.42 3.05 3.81
# fit a Bayesian GLM using rstanarm
library(rstanarm)
t_prior = student_t(df = 3, location = 0, scale = 100) # we set scale to large value to specify an uninformative prior
bfit1 = stan_glm(y ~ x1 + x2, data = d,
family = binomial(link = "logit"),
prior = t_prior, prior_intercept = t_prior,
chains = 1, cores = 4, seed = 123, iter = 10000)
# coefficients and 90% credible intervals :
round(cbind(coef(bfit1), posterior_interval(bfit1, prob = 0.9)), 2)
# 5% 95%
# (Intercept) -0.01 -0.18 0.17
# x1 2.06 1.79 2.37
# x2 3.45 3.07 3.85
# fit a Bayesian GLM using brms
library(brms)
priors = c(
prior(student_t(3, 0, 100), class = "Intercept"),
prior(student_t(3, 0, 100), class = "b")
)
bfit2 = brm(
y ~ x1 + x2,
data = d,
prior = priors,
family = "bernoulli",
seed = 123
)
# coefficients and 90% credible intervals :
summary(bfit2, prob=0.9)
# Population-Level Effects:
# Estimate Est.Error l-90% CI u-90% CI Eff.Sample Rhat
# Intercept -0.01 0.11 -0.18 0.18 2595 1.00
# x1 2.06 0.17 1.79 2.35 2492 1.00
# x2 3.45 0.23 3.07 3.83 2594 1.00
# fit a Bayesian GLM using arm
library(arm)
# we set prior.scale to Inf to specify an uninformative prior
bfit3 = bayesglm(y ~ x1 + x2, family = "binomial", data = d, prior.scale = Inf)
sims = coef(sim(bfit3, n.sims=1000000))
# coefficients and 90% credible intervals :
round(cbind(coef(bfit3), t(apply(sims, 2, function (col) quantile(col,c(.05, .95))))),2)
# 5% 95%
# (Intercept) 0.00 -0.18 0.17
# x1 2.04 1.76 2.33
# x2 3.42 3.03 3.80
ご覧のように、上記の例n=1000
では、2項GLMの90%プロファイル信頼区間は、ベイズ2項GLMの90%信頼区間と実質的に同一です(異なるシードを使用し、異なるベイズ近似での反復のnrs 。また、rstanarm
またはで100%情報価値のない事前確率を指定することもできないため、正確な等価性も取得できませんbrms
。