ランダムな量の信頼区間?


8

仮定a未知であるp -ベクトル、及び一方が観察。観測されたと既知のパラメーターのみに基づいて、ランダムな量信頼区間を計算したいと思います。つまり、与えられた、ような見つけます。bN(a,I)babpα(0,1)c(b,p,α)Pr(bac(b,p,α))=α

信頼区間に寄与するランダム性も影響するため、これは奇妙な質問です。単純明快なアプローチは、、として、、は、これはの期待値です。(は、最大スケーリングでは、非中心カイ二乗RVであり、非中心パラメーターはbbaN(b,I)baN(bb,bbI)bbaababbaa ; その期待値ははありません 。)aa

:無条件に、、および、つまり非中央のカイ二乗確率変数であることを意味します。したがって平均の不偏推定値である、及びその分散。後者はマイナスになる可能性があるため、少し役に立たないです。baN(aa,aa)bbχ(p,aa)bbpab

私はこの問題に取り組むためのありとあらゆる賢明な方法を探しています。これらには以下が含まれます。

  1. 関数である結合適切な信任、観測のと知られているように、すべてのおよびすべてのに対して、ます。編集これが意味するところは、を修正してからランダムな場合、その確率はは、繰り返し描画ではです。たとえば、を修正した場合cbpPr(bac(b,p,α))=ααaaa>0abbac(b,p,α)0αba次に、独立した、次に、が近づくようなの比率複製数が\ inftyになると、\ alphabiibiac(bi,p,α)α
  2. 「期待通り」の信頼限界。これは、観測されたb関数であり、無条件の期待値がすべての\ vec\ vec {b} ^ {\ top} \ vec {a}\ alpha分位になるように、既知のpおよびα{a}:\ vec {a} ^ {\ top} \ vec {a}> 0αbaa:aa>0
  3. で前もって正気を指定できる、ある種のベイジアンソリューション。次に、観測、両方の事後を取得しますおよび。aabbbaa

編集この質問の元の形がの共分散持っていたと、しかし私はそれを信じていWLOG 1だけで想定することができ、私はすべての言及うち、編集しているので、。b1nIn=1n


ランダムな量の「信頼区間」は通常「予測区間」と呼ばれます。
kjetil b halvorsen 2014

1
@kjetilbhalvorsen:Wikipediaによると、これは「将来の観測が落ちる間隔」を推定する予測間隔に関する質問ではありません。ベクトルはすでに観測されてます。b
shabbychef 2014

1
どのようにがこれに入るのか私にはまったくわかりません。明確にしていただけますか?p
ベン-モニカを

1
@Benは、ベクトルおよびです。pab
shabbychef

回答:


5

幾何学の問題とディストリビューションのビューba|b|2

以下は、問題の幾何学的ビューです。aの方向は実際には問題ではなく、これらのベクトルの長さを使用できます|a||b|すべての必要な情報を提供します。

幾何学的ビュー

ベクトルの射影の長さの分布 baあろうba/|a|N(|a|,1)あなたが探していることを量に関係しています

baN(|a|2,|a|2)

さらに、サンプルベクトルの2乗の長さを推定できます|b|2配布有する非中心カイ二乗分布の自由度で、p及びパラメータ非心k=1pμk2=|a|2

|b|2χp,|a|22

さらに

(|b|2(ba)2|a|2)conditional on ba and |a|2χp12

間隔推定、この最後の式が示すba できるので、特定の観点から、信頼区間として見ることbaの分布のパラメータとして見ることができます|b|2。しかし、迷惑なパラメータがあるため、複雑になります|a|2、また、パラメータはba itselveはに関連して、確率変数であります|a|2

分布のプロットとa c bp α を定義するいくつかの方法c(b,p,α)

共同分布のプロット

画像では、右使用して95%の領域に対してプロット上にβ1の分布の部分N(|a|2,|a|2)及び上部β2のシフト分布の一部χp12、その結果β1β2=0.05

今、大きなトリックは、いくつかのライン描画することですc(|β|2,p,α)のためにこのようなことをポイント境界いかなる a端数がある1αです(少なくとも)ポイントの下の行を。

複数の

線の下は領域が成功する場所であり、これを少なくとも時間の1α分数で発生させたい。(も参照の信頼区間を構築する基本的なロジックをして、私たちは?帰無仮説ではなく、サンプリングを経て製造信頼区間で帰無仮説拒否することができる類似の理由のためではなく、単純な設定にします)。

状況を把握することに成功できるかどうかは疑問です。

|a|:Pr(bac(b,p,α))=α

しかし、私たちは常に次のような結果を得ることができるはずです

|a|:Pr(bac(b,p,α))α

以上厳密少なくともアッパーのバインドされているすべてPr(bac(b,p,α))に等しく、α

sup{Pr(bac(b,p,α)):|a|0}=α

画像内の複数の線|a|単一の領域のピークに接する線を使用して、関数c(|b|,p,α)を定義します。これらのピークを使用することにより、我々は次のようであることを意図していた元の地域、ということですかα=β1β2最適にカバーされていません。代わりに、より少ない点が(したがって線下回るα>β1β2)。小さな|a|これらは上部になるでしょう|a|これは正しい部分です。だからあなたは得るでしょう:

|a|<<1:Pr(bac(b,p,α))β2|a|>>1:Pr(bac(b,p,α))β1

そして

sup{Pr(bac(b,p,α)):|a|0}max(β1,β2)

したがって、これはまだ少し作業中です。状況を解決する1つの可能な方法は、試行錯誤によって改善を続けるパラメトリック関数を使用して、線がより一定になるようにすることです(ただし、あまり洞察力がありません)。あるいは、ライン/関数の微分関数を記述することもできます。

有効アルファ

# find limiting 'a' and a 'b dot a'  as function of b² 
f <- function(b2,p,beta1,beta2) {
  offset <- qchisq(1-beta2,p-1)
  qma <- qnorm(1-beta1,0,1)
  if (b2 <= qma^2+offset) {
    xma = -10^5
  } else {
    ysup <- b2 - offset - qma^2
    alim <- -qma + sqrt(qma^2+ysup) 
    xma <- alim^2+qma*alim
  }
    xma
}  
fv <- Vectorize(f)  

# plot boundary
b2 <- seq(0,1500,0.1)
lines(fv(b2,p=25,sqrt(0.05),sqrt(0.05)),b2)


# check it via simulations
dosims <- function(a,testfunc,nrep=10000,beta1=sqrt(0.05),beta2=sqrt(0.05)) {
  p <- length(a)
  replicate(nrep,{
    bee <- a + rnorm(p)
    bnd <- testfunc(sum(bee^2),p,beta1,beta2)
    bta <- sum(bee * a)
    bta <= bnd
  })
}

mean(dosims(c(1,rep(0,7)),fv))

### plotting
# vectors of |a| to be tried
las2 <- 2^seq(-10,10,0.5) 
# different values of beta1 and beta2
y1 <- sapply(las2,FUN = function(las2) 
  mean(dosims(c(las2,rep(0,24)),fv,nrep=50000,beta1=0.2,beta2=0.2)))
y2 <- sapply(las2,FUN = function(las2) 
  mean(dosims(c(las2,rep(0,24)),fv,nrep=50000,beta1=0.4,beta2=0.1)))
y3 <- sapply(las2,FUN = function(las2) 
  mean(dosims(c(las2,rep(0,24)),fv,nrep=50000,beta1=0.1,beta2=0.4)))

plot(-10,-10,
     xlim=c(10^-3,10^3),ylim=c(0,0.5),log="x",
     xlab = expression("|a|"), ylab = expression(paste("effective ", alpha)))

points(las2,y1, cex=0.5, col=1,bg=1, pch=21)
points(las2,y2, cex=0.5, col=2,bg=2, pch=21)
points(las2,y3, cex=0.5, col=3,bg=3, pch=21)

text(0.001,0.4,expression(paste(beta[2], " = 0.4   ", beta[1], " = 0.1")),pos=4)
text(0.001,0.25,expression(paste(beta[2], " = 0.2   ", beta[1], " = 0.2")),pos=4)
text(0.001,0.15,expression(paste(beta[2], " = 0.1   ", beta[1], " = 0.4")),pos=4)

title(expression(paste("different effective ", alpha, " for different |a|"))) 

ランダムであり、関数F BP αはであるにもランダム。それでも、実験の複製の下で確率ステートメントが保持されるような関数を構築できると思います(固定aの場合)。bf(b,p,α)a
shabbychef

質問に答えるための一つの方法は、関数を見つけることであろうようにP BAF BP α = α複製が下にあり、固定のが、独立して実現B。ただし、実際には、1つだけbを観察します。(b自体が、いくつかの実験のいくつかの独立した実現について計算された、十分に再スケーリングされた十分な統計である可能性があることを認識してください。)fP(baf(b,p,α))=α abbb
シャビーシェフ

これはショー大型のためのもの、私の「答え」も参照してくださいこのパラメータの値が小さいために、それはより多くのようである一方で、特定の統計量が、ほぼ正常で、非中心カイ二乗を(シフト、再スケール)。つまり、aは未知の母集団パラメーターであるため、どちらが正しいかはわかりません。私たちは親切見積もりのことができます量からBB、しかし。aaaaabb
shabbychef

が方程式の両側にあることが重要である理由がわかりません。ただし、完全に明確になるように、もう一度質問を編集してみます。b
shabbychef

1
私は実際のコードで偽の回答を投稿しました。
shabbychef

3

表記をより身近なものに切り替えます。混乱しないことを願っています。

完全に偏りのない推定量を使用して関数を推定する方法がわかりません。ただし、シミュレーションで評価できるように、c関数の「部分」に偏りのない推定量を提供し、残りのバイアスの式を提供します。cc

共に正常な次元のランダム(列)ベクトルがあると仮定します。p

xN(μ,1nIp),μ=(μ1,...,μp)

共分散行列の指定により、ランダムベクトルの要素は独立しています。

私たちは単変量確率変数に興味を持っている。結合正規性により、この変数も正規分布になりますY=xμ

YN(μμ,1nμμ)

したがって

P(nYμμμμncμμμμ)=Φ(ncμμμμ)

ここで、は標準の標準CDFであり、Φ()

Φ(ncμμμμ)=αncμμμμ=Φ1(α)=zα

(1)c=μμnza+μμ

したがって、とその平方根の推定値を取得する必要があります。ベクトルの各要素についてのx、言うX K我々はN、使用可能なIID観察を{ X K 1x k n }。だから、の各要素に対してμ " μ = μ 2 1μ 2 P"聞かせてのは、推定をしてみてくださいμμxXkn{xk1,...,xkn}μμ=(μ12,...,μp2)

Est(μk2)=1ni=1nXki2

この推定量は期待値です

E(1ni=1nXki2)=1ni=1nE(Xki2)=1ni=1n(Var(Xki)+[E(Xki)]2)

E(μk2^)=1ni=1n(1n+μk2)=1n+μk2

だから公平のための推定量ありますμki2

μk2^=1ni=1nXki21n

implying that

E[k=1p(1ni=1nXki21n)]=1nE(k=1pi=1nXki2)pn=μμ

and so that

(2)θ^1nk=1pi=1nXki2pn
μμ.

But an unbiased estimator for μμ does not seem to exist (one that is solely based on the known quantities, that is).

So assume that we go on and estimate c by

(3)c^=θ^nza+θ^

The bias of this estimator is

B(c^)=E(c^c)=zαn[E(θ^)μμ]>0

the "positive bias" result due to Jensen's Inequality.

In this approach, the size n of the sample is critical, since it reduces bias for any given value of μ.

What are the consequences of this overestimation bias? Assume that we are given n,p, and we are told to calculate the critical value for Y for probability α, P(Yc)=α.

Given a sequence of samples, we will provide an estimate c^ for which, "on average" c^>c.

In other words

P(YE(c^))=α>α=P(Yc)

One could assess by simulation the magnitude of the bias for various values of μ, and how, and how much, it distorts results.


I believe this is towards an unbiased CI (option 2 in my edit), and similar in spirit to my unsatisfactory answer. I will think about how a better estimate of the standard deviation could be constructed with the available information. I think maybe a Taylor series might work. Also, I am not sure about the n observations of x part. We have n=1 wlog.
shabbychef

As you can see, the value of n matters when it comes to bias. So it depends by what you mean by "without loss of generality". A more practical issue is that if the formulas were provided for n=1, it would not be necessarily clear how exactly they should look for general n. Now they are provided for general n so one can plug in any value of n, and see what happens
Alecos Papadopoulos

The problem is that there is no n; It was only relevant in giving the background to the problem, and I should just erase it from the question. You only observe a single b (in your terminology, x, with n=1).
shabbychef

That creates no problem. Just insert 1 wherever n appears in my formulas.
Alecos Papadopoulos

1

An approach that almost works is as follows: Note that (bbba)/bb 'looks like' zc, where c is a unit-length vector (it is actually b scaled to unit length), and z=baN(0,I). If it were the case that c were independent of z, then one could claim that bb+Zαbb was a α confidence bound, where Zα is the α quantile of the normal.

However, c is not independent of z. It tends to be 'aligned with' z. Now, when aa1, c is essentially independent, and the confidence bound above gives proper coverage. When 0<aa1, however, zc is more like a shifted, scaled, non-central chi-square random variable.

A little R simulation shows the effects of aa on normality of the quantity (bbba)/bb:

z.sim <- function(p,eff.size,nsim=1e5) {
    a <- matrix(eff.size * rnorm(p),nrow=p)
    b <- rep(a,nsim) + matrix(rnorm(p*nsim),nrow=p)
    atb <- as.matrix(t(a) %*% b)
    btb <- matrix(colSums(b * b),nrow=1)
    isZ <- (btb - atb) / sqrt(btb)
}

set.seed(99) 
isZ <- z.sim(6,1e3)
jpeg("isZ.jpg")
qqnorm(isZ)
qqline(isZ)
dev.off()

jpeg("isChi.jpg")
isZ <- z.sim(6,1e-3)
qqnorm(isZ)
qqline(isZ)
dev.off()

a'a large case a'a small case


This looks like a multivariate folded normal to me...
shabbychef

This won't fly because the distribution depends on the unknown aa. Perhaps one could establish a prior on this quantity which would lead to a posterior on ab.
shabbychef

1

For the case p=1, we can find a two sided interval. In this case we can assume that 0<a is the population parameter, and we observe b=N(a,1). We wish to bound ab in probability with some function of |b| (We may only use absolute value of b as it is the one dimensional analogue of bb for the p>1 case.)

Let ϕ be the normal density function, and let zα/2 be the α/2 quantile of the normal. Then, trivially

ϕ(ba)I{|ab|zα/2}db=α.
Now note that |ab| is invariant with respect to multiplication of the inside by ±1, so we can multiply by sign(b). That is |ab|=|asign(b)|b||. Using this, then multiplying the quantities by |b| we have:
α=P(|asign(b)|b||zα/2),=P(|abb2|zα/2|b|),=P(ab[b2+zα/2|b|,b2zα/2|b|]).

Thus the symmetric interval [b2+zα/2|b|,b2zα/2|b|] has 1α coverage of ab.

Let's test with code:

test_ci <- function(a,nsim=100000,alpha=0.05) {
  b <- rnorm(nsim,mean=a,sd=1)
  b_lo <- b^2 + abs(b) * qnorm(alpha/2)
  b_hi <- b^2 + abs(b) * qnorm(alpha/2,lower.tail=FALSE)
  ab <- a*b
  isout <- ab < b_lo | ab > b_hi
  mean(isout) 
}
# try twice, with a 'small' and with a 'large'
set.seed(1234)
test_ci(a=0.01)
set.seed(4321)
test_ci(a=3.00)

I get the nominal 0.05 type I rate:

[1] 0.04983
[1] 0.04998

It's not clear how to turn this into a solution for the p>1 case, but I assume some trigonometry and use of the t distribution will apply.


0

Again, the question is to find function c() such that, if you fixed a, then under m independent draws of bi=a+zi, the proportion of i such that biac(bi,p,α) should go to α as m.

I will give a broken solution to illustrate how this should work in code. First note that bb is a non-central chi-square with non-centrality parameter λ=aa and d.f. p. So we have

E[bb]=p+aa.
Now note that baN(aa,aa). So in particular,
E[bbbap]=0.
Ignoring the covariance of ba and bb (at my own peril), I can mistakenly claim that the variance of this quantity is
Var[bbbap]=aa+2(p+2aa)=2p+5aa.
Putting these together I can make the outlandish and ludicrous claim that the α quantile of bbbap is around
Zα2p+5aa.
I then might incorrectly conclude that
Pr(babbp+Zα2p+5aa)α.
Since I do not know a, I could then further substitute in the expectation of bb to arrive at
c(b,p,α)=bbp+Zα0(5bb3p),
taking care of course to avoid estimating a negative standard deviation.

This is certainly not going to work because we ignored the covariance term. However, the point is to demonstrate some code:

# my broken 'c' function
cfunc <- function(bee,p=length(bee),alpha=0.05) {
  lam <- sum(bee^2)
  sig <- sqrt(max(0,5*lam - 3*p))
  lam - p + qnorm(alpha) * sig
}
# check it via simulations
dosims <- function(a,testfunc,nrep=10000,alpha=0.05) {
  p <- length(a)
  replicate(nrep,{
    bee <- a + rnorm(p)
    bnd <- testfunc(bee,p,alpha)
    bta <- sum(bee * a)
    bta <= bnd
  })
}
options(digits=5)
set.seed(1234)
mean(dosims(rep(0.01,8),cfunc))
mean(dosims(rep(0.1,8),cfunc))
mean(dosims(rep(1,8),cfunc))

I get nothing like the nominal 0.05 coverage:

[1] 0.0011
[1] 0.0018
[1] 0.001

You should be able to plug in a working confidence bound for the testfunc.

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.