信頼できる間隔にフラットな事前分布がある場合、95%の信頼区間は95%の信頼できる間隔に等しいですか?


31

私はベイジアン統計に非常に新しいので、これはばかげた質問かもしれません。それでも:

一様分布を指定する事前確率を使用した信頼できる間隔を検討します。たとえば、0から1で、0から1は効果の可能な値の全範囲を表します。この場合、95%の信頼区間は95%の信頼区間に等しいでしょうか?

回答:


23

多くの頻度論的信頼区間(CI)は、尤度関数に基づいています。事前分布が本当に情報価値がない場合、ベイジアン事後分布は本質的に尤度関数と同じ情報を持ちます。その結果、実際には、ベイジアン確率区間(または信頼できる区間)は、頻度的に信頼区間に数値的に非常に似ている場合があります。[もちろん、たとえ数値的に類似していても、頻度主義者とベイズの区間推定値の間には解釈に哲学的な違いがあります。]

以下は、二項の成功確率推定する簡単な例です。θ 我々が持っていると仮定しn=100と観測値(試験)バツ=73成功を。

Frequentist:伝統的なワルド間隔用途点推定値 θ = X / N = 73 / 100 = 0.73。そして、95%CIは、フォームのある θ ± 1.96 θ^=バツ/n=73/100=0.73。0.643

θ^±1.96θ^1θ^n
計算され0.6430.817
n = 100;  x = 73;  th.w = x/n;  pm = c(-1,1)
ci.w = th.w + pm*1.96*sqrt(th.w*(1-th.w)/n);  ci.w
[1] 0.6429839 0.8170161

この形式のCIは、関連する二項分布を正規分布で近似できること、および誤差範囲ウェルによって近似される θ1θ/n特にnが小さい場合これらの仮定は真である必要はありません。[X=0またはX=nの場合は特に問題があります。]θ^1θ^/nnバツ=0バツ=n

Agresti-Coull CIは、より正確なカバレッジ確率を有することが示されています。この間隔は、カバレッジ確率を95%に近づけるためのトリックとして、「2つの成功と2つの失敗」を追加します。これは、点推定値で始まる N + 4は次に95%CIがフォームである θ ± 1.96 θ=バツ+2/nn+4。 を計算し0.6120.792N>1000.3<θ<0.7信頼区間のこれらの2つのスタイルの違いはほとんど無視できる程度です。

θ±1.96θ1θn
(0.612,0.792).n>1000.3<θ~<0.7,
ci.a = th.a + pm*1.96*sqrt(th.a*(1-th.a)/n);  ci.a
[1] 0.6122700 0.7915761

ベイズ: 1つの一般noninformativeこの状況で前である尤度関数は、に比例する θ X1 - θ N - X事前分布と尤度のカーネルを乗算すると、事後分布のカーネル B e t ax + 1 Beta(1,1)Unif(0,1).θx(1θ)nx.Beta(x+1,nx+1).

次いで、95%ベイズ区間推定用途取得する事後分布の0.025と0.975の分位 事前分布が「フラット」または「非情報」である場合、ベイジアン確率区間とアグレスティ-コール信頼区間の数値差はわずかです。0.6350.807

qbeta(c(.025, .975), 74, 28)
[1] 0.6353758 0.8072313

注:(a)この状況では、一部のベイジアンは情報のない事前の好みます。(b)95%以外の信頼レベルの場合、Agresi-Coull CIはわずかに異なるポイント推定値を使用します。(c)二項分布以外のデータの場合、利用可能な「フラット」事前分布がない場合がありますが、非常に少ない情報を運ぶ大きな分散(精度が小さい)の事前分布を選択できます。(d)Agresti-Coull CI、カバレッジ確率のグラフ、およびいくつかの参考文献の詳細については、おそらくこのQ&Aも参照してください。Beta(.5,.5).


10

BruceETの答えは優れていますが、かなり長いので、簡単な実用的な要約を以下に示します。

  • 事前確率がフラットの場合、尤度と事後確率は同じ形状になります
  • ただし、間隔は異なる方法で構築されるため、間隔は必ずしも同じではありません。標準的なベイジアン90%CIは、後部の中央90%をカバーします。頻度の高いCIは通常、ポイントごとの比較によって定義されます(BruceETの答えを参照)。境界のない位置パラメーター(正規分布の平均の推定など)の場合、差は通常小さいですが、境界(0/1)に近い境界のパラメーター(2項平均など)を推定する場合、差は大きくなる可能性があります。
  • もちろん、解釈も異なりますが、主に「値が同じになるのはいつか」と解釈します。

9

頻度の高い信頼区間に等しい信頼できる区間が得られる事前分布を解くことができますが、適用範囲がどれほど狭いかを理解することが重要です。全体の説明では、サンプルサイズが固定されており、ランダム変数ではないと想定しています。データを1回だけ見て、順次推論が行われなかったと想定しています。従属変数は1つだけで、他のパラメーターは関係ないと想定しています。多重度がある場合、ベイジアン間隔と頻度間隔は分岐します(ベイジアン事後確率は前方時間予測モードであり、「ここに到達した方法」を考慮する必要がないため、複数の外観に調整する必要はありません)。加えて、


「前方予測モード」になるとはどういう意味ですか。選択または多重度の影響を考慮する必要がないのはなぜですか。
badmax

1
参照してくださいこれを。ゲームの進行に合わせて、サッカーの試合の勝者を予測することを考えてください。チームxがゲームに勝つ現在の確率は、過去の予測を完全に無視できます。ただし、フリークエンティストモードで操作する場合は、チームがゲームに負けたときを常に想定し、予測する傾向があるゲーム中のすべてのポイントで極端なスコアを考慮する必要があります。多重度は、データを極端に与える可能性に起因します。この要因は、頻繁な計算にのみ影響します。
フランクハレル

6

尤度事前確率がフラットのベイジアン

尤度関数、および信頼区間に関連付けられているものは、均一な分布を指定する事前確率で構築されたベイジアン事後確率と同じ(概念)ではありません

この回答の第1部と第2部では、なぜ尤度をフラットな事前確率に基づいたベイジアン事後確率と見なすべきではないかを議論しています。

パート3では、信頼区間と信頼区間が大きく変化する例を示します。また、この矛盾がどのように生じるかが指摘されています。

1変数が変換されるときの異なる動作

確率は特定の方法で変換されます。我々は確率分布の分布がわかっている場合はfバツバツその後、我々はまた、の分布を知るfξξ変数に対するξ任意の関数で定義されたがバツ=χξ、変換規則に従って。

fξξ=fバツχξdχdξdξ

変数を変換する場合、分布関数のこの変更により、平均とモードが異なる場合があります。その手段バツ¯χξ¯バツ最大fバツχξ最大fξ

尤度関数は、この方法で変換しませ。これは、尤度関数と事後確率の対比です。変数を変換しても、(最大の)尤度関数は同じままです。

Lξξ=Lバツχξ

関連:

  • 平坦な事前分布はあいまいです。特定の統計の形式によって異なります。

    例えば、場合バツ(例えば、分散均一であるうん01次に、バツ2、ISません均一に分布変数。

    尤度関数を関連付けることができる単一のフラットはありません。バツまたはバツ2などの変換された変数のフラット事前定義を定義する場合は異なります。可能性のために、この依存関係は存在しません。

  • 変数を変換すると、確率の境界(信頼区間)が異なります(尤度関数の場合はそうではありません)。例えば、あるパラメータaと単調変換fa(対数など)の場合、同等の尤度間隔

    a<a<a最大fa<fa<fa最大

2異なる概念:信頼区間は事前分布から独立しています

あなたは、変数サンプルとしバツ(不明)パラメータを持つ集団からθ自体(パラメータを持つ人口θ)(のための可能性の変化値を持つ超母集団からサンプリングされましたθ)。

変数Xのいくつかの値x iを観察することに基づいて、元のθが何であったかを推測しようとする逆ステートメントを作成できます。バツバツ

  • ベイジアン法は、可能なθの分布の事前分布を仮定することによりこれを行いますθ
  • これは、事前分布から独立した尤度関数と信頼区間とは対照的です。

信頼区間はいません、信頼区間のように事前分布の情報を使用(信頼は確率ではありません)。

事前分布(均一または非均一)に関係なく、x%信頼区間にはxの真のパラメーターが含まれます。バツ、ケースのに(信頼区間は、特定のケースではなく、メソッドの成功率、タイプIエラーを指します)。

信頼できる間隔の場合、この概念(間隔に真のパラメーターが含まれる時間)は適用できませんが、それを頻繁に解釈して、信頼できる間隔に(均一な)事前分布が正しくバツ遭遇する可能性のあるパラメータの超集団を記述する。間隔は、x%よりも効果的に高いまたは低いパフォーマンスを示している可能性があります(ベイジアンアプローチはさまざまな質問に答えるため、これは重要ではありませんが、違いに注意するだけです)。

3信頼区間と信頼区間の違い

λバツ¯n

L(λ,x¯,n)=nn(n1)!xn1λneλnx¯

this functions expresses the probability to observe (for a given n and λ) a sample mean between x¯ and x¯+dx.

note: the rate parameter λ goes from 0 to (unlike the OP 'request' from 0 to 1). The prior in this case will be an improper prior. The principles however does not change. I am using this perspective for easier illustration. Distributions with parameters between 0 and 1 are often discrete distributions (difficult to drawing continuous lines) or a beta distribution (difficult to calculate)

The image below illustrates this likelihood function (the blue colored map), for sample size n=4, and also draws the boundaries for the 95% intervals (both confidence and credible).

信頼区間と信頼区間の違い

The boundaries are created obtaining the (one-dimensional) cumulative distribution function. But, this integration/cumulation can be done in two directions.

The difference between the intervals occurs because the 5% area's are made in different ways.

  • The 95% confidence interval contains values λ for which the observed value x¯ would occur at least in 95% of the cases. In this way. whatever the value λ, we would only make a wrong judgement in 95% of the cases.

    For any λ you have north and south of the boundaries (changing x¯) 2.5% of the weight of the likelihood function.

  • The 95% credible interval contains values λ which are most likely to cause the observed value x¯ (given a flat prior).

    Even when the observed result x¯ is less than 5% likely for a given λ, the particular λ may be inside the credible interval. In the particular example higher values of λ are 'preferred' for the credible interval.

    For any x¯ you have west and east of the boundaries (changing λ) 2.5% of the weight of the likelihood function.

A case where confidence interval and credible interval (based on improper prior) coincide is for estimating the mean of a Gaussian distributed variable (the distribution is illustrated here: https://stats.stackexchange.com/a/351333/164061 ).

An obvious case where confidence interval and credible interval do not coincide is illustrated here (https://stats.stackexchange.com/a/369909/164061). The confidence interval for this case may have one or even both of the (upper/lower) bounds at infinity.


2
信頼できる間隔に真のパラメーターが含まれているかどうかについては話さないでください。信頼できる間隔は、確率ステートメントを作成しています。そして、信頼区間のx%は、複製の意味、つまり「ケース」とは何かを言及する必要があります。
フランクハレル

First bullet is why some Bayesians prefer prior Beta(.5,.5) as mentioned in the Note at the end of my problem. // Wald intervals do not provide the advertised level of coverage because of the approximations involved. (Not precisely based on likelihood.)
ブルース

I don't believe I said that with a flat prior the likelihood is the posterior, even though that can be the case. Consistent with writing an answer at what I supposed to be OP's level of expertise, I tried to write the first paragraph of my Answer carefully. Do you believe what I said is actually wrong, or are you saying it might be misinterpreted?
ブルース

1

This is not generally true, but it may seem so because of the most frequently considered special cases.

Consider X,Yi.i.dUniform[θ1/2,θ+1/2]. The interval (min{X,Y},max{X,Y}) is a 50% confidence interval for θ, albeit not one that anyone with any common sense would use. It does not coincide with a 50% credible interval from the posterior from a flat prior.

Fisher's technique of conditioning on an ancillary statistic does in this case yield a confidence interval that coincides with that credible interval.


0

私の読書から、私はこの声明が漸近的に真実であると思った。すなわち、サンプルサイズが大きく、情報量の少ない事前分布を使用している場合。

単純な数値例はこれを確認するように思われます-ML二項GLMとベイジアン二項GLMの90%プロファイル最尤区間と90%信頼区間は、実際にはほぼ同一ですがn=1000、小さな場合は不一致が大きくなりnます:

# simulate some data
set.seed(123)
n = 1000                     # sample size
x1 = rnorm(n)                # two continuous covariates 
x2 = rnorm(n)
z = 0.1 + 2*x1 + 3*x2        # predicted values on logit scale
y = rbinom(n,1,plogis(z))    # bernoulli response variable
d = data.frame(y=y, x1=x1, x2=x2)

# fit a regular GLM and calculate 90% confidence intervals
glmfit = glm(y ~ x1 + x2, family = "binomial", data = d)
library(MASS)
# coefficients and 90% profile confidence intervals :
round(cbind(coef(glmfit), confint(glmfit, level=0.9)), 2) 
#                      5 % 95 %
#   (Intercept) 0.00 -0.18 0.17
# x1            2.04  1.77 2.34
# x2            3.42  3.05 3.81

# fit a Bayesian GLM using rstanarm
library(rstanarm)
t_prior = student_t(df = 3, location = 0, scale = 100) # we set scale to large value to specify an uninformative prior
bfit1 = stan_glm(y ~ x1 + x2, data = d, 
                 family = binomial(link = "logit"), 
                 prior = t_prior, prior_intercept = t_prior,  
                 chains = 1, cores = 4, seed = 123, iter = 10000)
# coefficients and 90% credible intervals :
round(cbind(coef(bfit1), posterior_interval(bfit1, prob = 0.9)), 2) 
#                        5%  95%
#   (Intercept) -0.01 -0.18 0.17
# x1             2.06  1.79 2.37
# x2             3.45  3.07 3.85


# fit a Bayesian GLM using brms
library(brms)
priors = c(
  prior(student_t(3, 0, 100), class = "Intercept"),
  prior(student_t(3, 0, 100), class = "b")
)
bfit2 = brm(
  y ~ x1 + x2,
  data = d,
  prior = priors,
  family = "bernoulli",
  seed = 123 
) 
# coefficients and 90% credible intervals :
summary(bfit2, prob=0.9)
# Population-Level Effects: 
#           Estimate Est.Error l-90% CI u-90% CI Eff.Sample Rhat
# Intercept    -0.01      0.11    -0.18     0.18       2595 1.00
# x1            2.06      0.17     1.79     2.35       2492 1.00
# x2            3.45      0.23     3.07     3.83       2594 1.00


# fit a Bayesian GLM using arm
library(arm)
# we set prior.scale to Inf to specify an uninformative prior
bfit3 = bayesglm(y ~ x1 + x2, family = "binomial", data = d, prior.scale = Inf) 
sims = coef(sim(bfit3, n.sims=1000000))
# coefficients and 90% credible intervals :
round(cbind(coef(bfit3), t(apply(sims, 2, function (col) quantile(col,c(.05, .95))))),2)
#                       5%  95%
#   (Intercept) 0.00 -0.18 0.17
# x1            2.04  1.76 2.33
# x2            3.42  3.03 3.80

ご覧のように、上記の例n=1000では、2項GLMの90%プロファイル信頼区間は、ベイズ2項GLMの90%信頼区間と実質的に同一です(異なるシードを使用し、異なるベイズ近似での反復のnrs 。また、rstanarmまたはで100%情報価値のない事前確率を指定することもできないため、正確な等価性も取得できませんbrms

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.