注文統計を介して推定値がパーセンタイルに収束することを示します


10

LET からサンプリングIIDランダム変数のシーケンスであるアルファ安定分布パラメータで、α = 1.5 X1,X2,,X3nα=1.5,β=0,c=1.0,μ=1.0

今配列検討Y J + 1 = X 3 J + 1 X 3 J + 2 X 3 J + 3 - 1、用J = 0 ... N - 1Y1,Y2,,YnYj+1=X3j+1X3j+2X3j+31j=0,,n1

パーセンタイルを推定したいと思います。0.01

私のアイデアは、一種のモンテカルロシミュレーションを実行することです。

l = 1;
while(l < max_iterations)
{
  Generate $X_1, X_2, \ldots, X_{3n}$ and compute $Y_1, Y_2, \ldots, Y_{n}$;
  Compute $0.01-$percentile of current repetition;
  Compute mean $0.01-$percentile of all the iterations performed;
  Compute variance of $0.01-$percentile of all the iterations performed;
  Calculate confidence interval for the estimate of the $0.01-$percentile;

  if(confidence interval is small enough)
    break;

}

すべてのサンプルの平均値を呼び出すパーセンタイルがあることを計算μ nは、その分散σ 2 のnに対して適切な信頼区間を計算するために、μを、私はに頼る中心極限定理の強力な形式0.01μ^nσ^n2μ

レッツとiid確率変数のシーケンスであるE [ X I ] = μ0 < V [ X I ] = σ 2 < 。試料の平均を定義μ N = 1 / N Σ N iが= 1、XがI。次いでμ N - μ /X1,X2,E[Xi]=μ0<V[Xi]=σ2<μ^n=(1/n)i=1nXiすなわち制限標準正規分布を持っている、 μのn -μ(μ^nμ)/σ2/n

μ^nμσ2/nnN(0,1).

そしてSlutksyの定理はそれを結論付ける

nμ^nμσ^n2nN(0,1).

その場合、μの信頼区間は、(1α)×100%μ

ここで、Z1-α/2である1-α/2標準正規分布の-quantile。

Iα=[μ^nz1α/2σ^n2n,μ^n+z1α/2σ^n2n],
z1α/2(1α/2)

質問:

1)私のアプローチは正しいですか?CLTの適用を正当化するにはどうすればよいですか?つまり、分散が有限であることをどのように示すことができますか?(の分散を確認する必要がありますか?有限であるとは思わないので...)Yj

0.010.01


3
stats.stackexchange.com/questions/45124でサンプル中央値に適用されるすべてのメソッドは、他のパーセンタイルにも適用されます。実際、あなたの質問はその質問と同じですが、50パーセンタイルを1パーセンタイル(またはおそらく0.01ですか?)に置き換えるだけです。
whuber

@whuber、その質問に対するあなたの答えは非常に良いです。ただし、Glen_bは彼の投稿の最後に(受け入れられた回答)、CLTがそこにキックしないため、おおよその正規性は「極端な分位数には当てはまりません(Zの平均は漸近的に正常ではないため) )極端な値には別の理論が必要です。」この声明について私はどの程度心配すべきですか?
Maya

2
私は彼が極端な分位数を実際に意味したのではなく、極端な部分だけを意味していたと思います。(実際、彼は同じ文章の終わりにある「極端な値」を参照して、その失効を修正しました。)違いは、0.01パーセンタイル(これは、分布)は制限内で安定します。これは、サンプル内のより多くのデータが依然としてそのパーセンタイルを下回り、より多くがそのパーセンタイルを下回るからです。極端なくなった場合である(例えば、最大値または最小値など)。
whuber

これは、経験的プロセス理論を使用して一般に解決する必要がある問題です。トレーニングのレベルについてのヘルプが参考になります。
AdamO

回答:


2

YXα=3/2μYσ2Xi

σ2=Var(Y)=E(Y2)E(Y)2=E(X12X22X32)E(X1X2X3)2=E(X2)3(E(X)3)2=(Var(X)+E(X)2)3μ6=(Var(X)+μ2)3μ6.

Var(X)Var(X)


次の質問に移りましょう。

サンプルが大きくなるにつれて、どのサンプル分位点も真の分位点に収束します。 次のいくつかの段落は、この一般的なポイントを証明しています。

q=0.0101FZq=F1(q)qth

F1ϵ>0q<qq+>q

F(Zqϵ)=q,F(Zq+ϵ)=q+,

ϵ0[q,q+]{q}

nZq(q,n)qZqnZqnqnq(1q)Φnq

1Φ(nqnqnq(1q))=1Φ(nqqq(1q)).

の引数のでΦnnΦ1

nqZqnqZq+qZqϵZq+ϵ

ϵ1αnnq1αϵZq


q=0.50

図:Yの0.01分位数のヒストグラム(n = 300、1000回の反復)

q=0.01Yn=300Y

library(stabledist)
n <- 3e2
q <- 0.01
n.sim <- 1e3

Y.q <- replicate(n.sim, {
  Y <- apply(matrix(rstable(3*n, 3/2, 0, 1, 1), nrow=3), 2, prod) - 1
  log(-quantile(Y, 0.01))
})
m <- median(-exp(Y.q))
hist(Y.q, freq=FALSE, 
     main=paste("Histogram of the", q, "quantile of Y for", n.sim, "iterations" ),
     xlab="Log(-Y_q)",
     sub=paste("Median is", signif(m, 4), 
               "Negative log is", signif(log(-m), 4)),
     cex.sub=0.8)
abline(v=log(-m), col="Red", lwd=2)
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.